O seu período de teste terminou!
Para acesso total à funcionalidade, pague uma subscrição premium
AI
AISec [x\x feed]
https://t.me/aisecnews
Idade do canal
Criado
Linguagem
Japonês
0.57%
ER (semana)
2.91%
ERRAR (semana)

Some "sohranyonki" about AI Security - without paywall and ads. X, articles, researchs and tools.

Pwn AI [channel] - @pwnai

Mensagens Estatísticas
Repostagens e citações
Redes de publicação
Satélites
Contatos
História
Principais categorias
As principais categorias de mensagens aparecerão aqui.
Principais menções
Não foram detectadas menções significativas.
Encontrado 294 resultados
3
87
https://arxiv.org/abs/2504.07831
19.04.2025, 12:14
t.me/aisecnews/6201
1
87
https://arxiv.org/pdf/2502.20995
14.04.2025, 14:25
t.me/aisecnews/6200
Repostar
4
98
📖 Новое исследование от Anthropic показало, что ИИ скрывает свои "мысли"

Недавнее исследование команды Alignment Science в Anthropic показало, что даже продвинутые модели ИИ, такие как Claude 3.7 Sonnet, систематически скрывают реальные рассуждения, лежащие в основе их ответов. В тестах на проверку «цепочек рассуждений» (chain-of-thought) модели скрывали истинные источники своей логики — включая пользовательские подсказки и визуальные шаблоны — до 80% случаев.

Более того, оказалось, что чем сложнее задача, тем меньше честности в объяснениях. Результаты исследования ставят под сомнение существующие подходы к интерпретируемости: если модели не могут прозрачно объяснить даже простые решения, можно ли доверять их «откровенности» в более серьезных вопросах? Это также может затруднить разработку адекватных механизмов прозрачности регуляторами и специалистами по безопасности ИИ.

#AI #ИИ
13.04.2025, 18:16
t.me/aisecnews/6199
6
61
https://github.com/PromptLabs/Prompt-Hacking-Resources
10.04.2025, 13:27
t.me/aisecnews/6198
1
62
https://security.googleblog.com/2025/04/google-launches-sec-gemini-v1-new.html?m=1
6.04.2025, 01:47
t.me/aisecnews/6197
1
71
https://arxiv.org/pdf/2406.01637
5.04.2025, 21:18
t.me/aisecnews/6196
71
https://glama.ai/mcp/servers/@mlobo2012/Claude_Desktop_API_USE_VIA_MCP/inspect
5.04.2025, 21:12
t.me/aisecnews/6195
72
https://github.com/AI4Good24/PsySafe/tree/main
5.04.2025, 12:48
t.me/aisecnews/6194
1
73
https://github.com/lancopku/agent-backdoor-attacks
4.04.2025, 23:04
t.me/aisecnews/6193
73
https://www.freebuf.com/articles/database/426633.html
4.04.2025, 23:01
t.me/aisecnews/6192
4
67
https://protectai.com/blog/securing-agentic-ai
4.04.2025, 09:39
t.me/aisecnews/6191
1
65
https://github.com/GAIR-NLP/DeepResearcher
3.04.2025, 22:05
t.me/aisecnews/6190
Repostar
2
74
У DeepSeek есть API, но за его использование хотят денег.

Но на платный API всегда найдётся человек с неофициальным враппером.

Например - DeeperSeek, небольшая библиотека на Python, позволяющая делать запросы к API DeepSeek бесплатно и с обходом защиты Cloudflare. Документация пока хромает, готовых инструментов с её использованием пока не нашёл. Но что-то работающее можем собрать.

Ставим библиотеку:
pip3 install DeeperSeek -U

Для начала можно использовать мой пример:
import os
import asyncio
import sys
from DeeperSeek import DeepSeek, Theme


async def main():
api = DeepSeek(
# Можно использовать связку email/pass или userToken
# email = "email@domain.com",
# password = "secret_password",
# token = "userToken_from_LocalStorage",
token = os.getenv('DEEPSEEK_USER_TOKEN'),
chrome_args = [],
verbose = True,
headless = True,
attempt_cf_bypass = True,
)
await api.initialize()
'''
Передаём текст из sys.argv при запуске скрипта
в примерах обычно строка "Hey DeepSeek!"
'''
response = await api.send_message(
sys.argv[1],
deepthink = True,
search = False,
slow_mode = True,
slow_mode_delay = 0.25,
timeout = 60,
)

print(response.text, response.chat_id)

# Можно использовать для отладки
# token = await api.retrieve_token()
# print(f"Session Token: {token}")

asyncio.run(main())

На каждый запрос будет создан новый чат, тут у меня готового решения нет. Но оно работает.

Github: DeeperSeek
Github: DeeperSeek Docs
Pypi: DeeperSeek
3.04.2025, 20:22
t.me/aisecnews/6189
Repostar
4
78
AI Penetration Testing: How to Secure LLM Systems
https://www.offsec.com/blog/ai-penetration-testing/

Explore how AI penetration testing enhances LLM security, addressing unique vulnerabilities and improving cyber defenses.
The post AI Penetration Testing: How to Secure LLM Systems (https://www.offsec.com/blog/ai-penetration-testing/) appeared first on OffSec (https://www.offsec.com/).
3.04.2025, 18:33
t.me/aisecnews/6188
4
76
https://github.com/allie-secvendors/insecure-ai-agents
2.04.2025, 12:13
t.me/aisecnews/6187
66
http://221.179.172.81/images/20250401/47021743476097906.pdf
2.04.2025, 00:09
t.me/aisecnews/6186
Repostar
61
Просочились детали про открытую модель от OpenAI (https://t.me/gonzo_ML/3521). По данным The Information (https://www.theinformation.com/briefings/openai-plans-release-free-model-reasoning-coming-months) у OpenAI уже есть эта модель и в данный момент она проходит тестирования безопасности.

Что известно про модель:

* Middle-sized model, то есть вероятно в районе 20-70B, также будет маленькая версия или несколько, чтобы можно было гонять on-device

* Модель мультиязычная, с поддержкой function calling. Ну этим сейчас уже никого не удивишь, необходимый минимум, не то что год назад (https://t.me/gonzo_ML/2821). Надеюсь, в отличие от Гугла (https://t.me/gonzo_ML/3447) список языков опубликуют?

* Это будет reasoning модель, что уже интересно. Reasoning модели такого размера нет, DeepSeek не для простых смертных с его 8x H200 (https://t.me/gonzo_ML/3239), и нишу для домашнего и мобильного использования пока ещё никто не занял, OpenAI будет первым (если новая Llama не обгонит).

* Модель мультимодальная, но что совсем интересно, в модальности будет аудио и новая модель в каком-то смысле является миксом Whisper и o3-mini. Про картиночную модальность неизвестно, но звук на входе и выходе это очень интересно, особенно мультиязычный. В on-device устройствах OpenAI планирует заюзать одновременно NPU и DSP (для звука они хороши), что видимо заметно улучшит скорость работы.

* Но что совсем бомба, это что ризонинг может идти в звуковой модальности! Модели будут рассуждать вслух! Но чтобы не сильно отвлекать пользователя, рассуждать модель будет шёпотом (Whisper же!). Если можно будет менять голос для ризонинга, то можно запускать GPT-радиостанцию!

Инсайдеры сообщают, что уже тестируют устную математику, но модель пока постоянно забывает перенести единичку.

Самый главный вопрос -- название модели пока неизвестно.

Хорошо, хорошо. Ждём ответку от Meta и Google. Ходят слухи, что Цукерберг уже нанял Eminem'а, чтобы обучить свою модель ритмичному reasoning'у под бит. А в Google DeepMind созвали экстренное совещание и, кажется, планируют выпустить би-ризонинг, когда модель играет сразу две роли, обычную и критика, причём разными голосами -- не просто так ведь модель называется Gemini. И она на самом деле уже тоже есть и проходит тестирования, включая старый добрый NotebookLM (https://t.me/gonzo_ML/2976) -- помните подкасты?
1.04.2025, 22:23
t.me/aisecnews/6185
1
https://www.secrss.com/articles/77278
1.04.2025, 20:09
t.me/aisecnews/6184
Repostar
1
57
Critical AI Security Guidelines by SANS Institute (Draft)

🔐 Access: Use least privilege + zero trust. Lock down models, vector DBs, and APIs.

📦 Data: Protect training + augmentation data. No sensitive info in prompts. Sanitize everything.

🚀 Deployment: Avoid hardcoding rules into LLMs. Use RAG + ACLs. Vet public models for backdoors.

🧠 Inference: Validate inputs and outputs. Guardrails help, but can't be your only defense.

📊 Monitoring: Log prompts, watch for drift, detect abuse. Monitor API usage closely.

⚖️ GRC: Track AI usage, align with evolving regs (EU AI Act, EO 14110, etc). Build AIBOMs + model registries.
1.04.2025, 07:43
t.me/aisecnews/6182
Repostar
2
57
1.04.2025, 07:43
t.me/aisecnews/6183
1
61
https://medium.com/enkrypt-ai/from-power-to-pitfalls-the-real-challenges-of-ai-agents-e5d503dd5870
31.03.2025, 20:38
t.me/aisecnews/6181
Repostar
1
54
Искусственный интеллект под реальной угрозой: почему специалисты по безопасности ИИ становятся всё более востребованными?

Повсеместное внедрение искусственного интеллекта (ИИ) в бизнес-процессы бросает новые вызовы рынку. Так, уже растет спрос на услуги специалистов по кибербезопасности в области ИИ (MLSecOps). По подсчетам аналитиков платформы hh.ru, в 2024 году количество вакансий разработчиков и аналитиков, связанных с защитой ИИ-решений, увеличилось в 5 раз.

Эксперты отмечают, что такие угрозы, как "Prompt Injection", "Best-of-N Jailbreaking" и "Data Poisoning", требуют новых подходов к безопасности. Специалисты MLSecOps играют ключевую роль в предотвращении утечек данных и обеспечении конфиденциальности моделей. Без должной защиты компании рискуют потерять не только данные, но и доверие клиентов.

Образование в этой области также развивается. Вузы начинают предлагать специализированные курсы по безопасности ИИ. Однако нехватка квалифицированных кадров остаётся актуальной проблемой, что ведёт к росту заработных плат и конкуренции среди работодателей.

Потребность в продвинутых дата-аналитиках с функциями LLM Security будет расти в ближайшие годы, прогнозирует директор по талантам ГК Swordfish Security Дарья Фигуркина.
«Компании-новаторы в том или ином формате уже активно применяют большие языковые модели в работе, но массово вопрос кибербезопасности ИИ встанет позже. Безопасность всегда следует рука об руку с разработкой, поэтому в ближайшие два-три года мы ожидаем роста запросов на создание центров компетенций по LLM Security (MLSecOps) для коммерческих компаний».

Подробнее читайте по ссылке 🖥

#ЭкспертизаSFS
31.03.2025, 19:12
t.me/aisecnews/6180
62
https://crad.ict.ac.cn/article/cstr/32373.14.issn1000-1239.202440265
30.03.2025, 18:00
t.me/aisecnews/6179
45
https://zhuanlan.zhihu.com/p/29666515909
30.03.2025, 17:57
t.me/aisecnews/6178
2
63
https://aisafetychina.substack.com/p/ai-safety-in-china-2024-in-review
30.03.2025, 10:54
t.me/aisecnews/6177
Repostar
2
59
MCP Server for IDA Pro
https://github.com/mrexodia/ida-pro-mcp:

1. Available functionality: There are a few IDA Pro MCP servers floating around, but I created my own for a few reasons: To install the MCP server in Cline, follow these steps: This will open a web interface at http://localhost:5173 and allow you to interact with the MCP tools for testing.
2. Adding new features is a super easy and streamlined process.
3. Below is a video where I add the get_metadata function in less than 2 minutes (including testing): MCP Server for IDA Pro

@secharvester
29.03.2025, 23:54
t.me/aisecnews/6176
52
https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=10916629
29.03.2025, 22:20
t.me/aisecnews/6175
1
52
https://medium.com/@adarshpandey180/scanning-an-llm-for-agent-based-vulnerabilities-51394999f30f
29.03.2025, 22:04
t.me/aisecnews/6174
47
https://github.com/hackysterio/owasp-risk-calculator
29.03.2025, 22:01
t.me/aisecnews/6173
41
https://github.com/caspiankeyes/AEON-AI-Interpretability-Framework
29.03.2025, 21:57
t.me/aisecnews/6172
38
29.03.2025, 21:55
t.me/aisecnews/6171
39
29.03.2025, 21:55
t.me/aisecnews/6170
40
https://github.com/GreenmaskIO/greenmask
29.03.2025, 21:52
t.me/aisecnews/6169
1
PostgreSQL database anonymization and synthetic data generation tool
29.03.2025, 21:52
t.me/aisecnews/6168
38
https://github.com/Mohamedkotb97/Cybersecurity-Threat-Intelligence-Analyst
29.03.2025, 21:51
t.me/aisecnews/6167
3
38
https://github.com/zjuguxi/dragonsec
29.03.2025, 21:45
t.me/aisecnews/6166
42
https://github.com/srafiuzzaman/AI-Security-and-Privacy
29.03.2025, 21:44
t.me/aisecnews/6165
45
https://github.com/farestrad/LLM-Assisted-Secure-Coding
29.03.2025, 21:43
t.me/aisecnews/6164
48
https://github.com/kenhuangus/ZeroTrustAgent
29.03.2025, 20:57
t.me/aisecnews/6163
5
51
29.03.2025, 20:48
t.me/aisecnews/6162
50
29.03.2025, 20:48
t.me/aisecnews/6161
1
50
https://ttps.ai/matrix.html

new ttps
29.03.2025, 20:46
t.me/aisecnews/6159
1
51
29.03.2025, 20:46
t.me/aisecnews/6160
1
51
https://www.linkedin.com/pulse/mcp-server-key-agentic-ai-interoperability-what-mohit-sewak-ph-d--rvhec/
29.03.2025, 20:40
t.me/aisecnews/6158
46
https://www.xenonstack.com/blog/agentic-ai-compliance
29.03.2025, 20:39
t.me/aisecnews/6157
44
https://www.arthur.ai/blog/exploring-agentic-ai-systems
29.03.2025, 20:39
t.me/aisecnews/6156
46
https://www.airisksummit.com/
29.03.2025, 20:16
t.me/aisecnews/6155
1
47
https://www.sans.org/cyber-security-training-events/ai-summit-2025/
29.03.2025, 20:14
t.me/aisecnews/6154
2
45
29.03.2025, 19:30
t.me/aisecnews/6153
2
45
29.03.2025, 19:30
t.me/aisecnews/6152
2
46
29.03.2025, 19:30
t.me/aisecnews/6150
2
45
29.03.2025, 19:30
t.me/aisecnews/6151
1
48
29.03.2025, 19:26
t.me/aisecnews/6149
2
47
29.03.2025, 19:26
t.me/aisecnews/6148
45
https://arxiv.org/pdf/2503.08195
29.03.2025, 19:20
t.me/aisecnews/6147
1
45
https://ai-cybersecurity-hackathon.devpost.com/project-gallery
29.03.2025, 19:09
t.me/aisecnews/6146
3
47
29.03.2025, 18:57
t.me/aisecnews/6145
48
29.03.2025, 18:57
t.me/aisecnews/6144
1
45
https://arxiv.org/pdf/2503.19626
29.03.2025, 18:54
t.me/aisecnews/6143
43
https://www.plexal.com/ai-security-innovation-growth-national-security/
29.03.2025, 18:53
t.me/aisecnews/6142
45
https://arxiv.org/pdf/2502.14529
29.03.2025, 18:15
t.me/aisecnews/6141
50
https://technode.global/2025/03/26/the-future-of-multi-ai-agent-security-technology-in-enterprise-systems/
29.03.2025, 18:04
t.me/aisecnews/6140
52
https://arxiv.org/pdf/2502.19145
29.03.2025, 18:02
t.me/aisecnews/6139
2
51
https://cloudsecurityalliance.org/blog/2025/03/24/threat-modeling-openai-s-responses-api-with-the-maestro-framework
29.03.2025, 18:00
t.me/aisecnews/6138
1
47
https://medium.com/@bijit211987/agentic-security-framework-1c253af8a223
29.03.2025, 11:00
t.me/aisecnews/6137
2
51
https://www.udemy.com/course/agentic-ai-risk-and-cybersecurity-masterclass-2025/
29.03.2025, 10:51
t.me/aisecnews/6136
1
45
https://systemweakness.com/threat-modeling-computer-using-agent-cua-part-1-45560879be96
29.03.2025, 10:50
t.me/aisecnews/6135
2
40
https://medium.com/@arshriz/mastering-threat-modeling-for-agentic-rag-architectures-on-aws-a-stride-based-guide-e7876c8db26d
29.03.2025, 10:49
t.me/aisecnews/6134
39
https://milev.ai/research/fortnightly-digest-4-march-2025/
29.03.2025, 10:41
t.me/aisecnews/6133
Repostar
39
🧾 AI Incident Digest – This Week

1️⃣ Fraudulent Prompts via AIXBT Dashboard Led AI Trading Agent to Transfer 55.5 ETH from Simulacrum Wallet
https://cryptonews.com/news/hacker-exploits-ai-crypto-bot-aixbt-steals-55-eth/ [#Cryptonews]

2️⃣ Manipulated Video Using AI-Generated Audio Targets Pakistan's Prime Minister Shehbaz Sharif with Fabricated Interview
https://www.dawn.com/news/1900242/fact-check-video-doesnt-show-anchor-confronting-pm-shehbaz-about-funding-umrah-for-30-member-delegation [#Dawn]

3️⃣ LLM Scrapers Allegedly Target Multiple Open Source Projects Disrupting the FOSS Ecosystem
https://thelibre.news/foss-infrastructure-is-under-attack-by-ai-companies/ [#TheLibre]

4️⃣ OpenAI’s Sora Is Plagued by Sexist, Racist, and Ableist Biases
https://www.wired.com/story/openai-sora-video-generator-bias/ [#WIRED]

5️⃣ AI-Enabled Organized Crime Expands Across Europe
https://thefuturemedia.eu/ai-powered-crime-europol-warns-of-a-new-era-in-organised-crime/ [#TheFutureMedia]
29.03.2025, 10:27
t.me/aisecnews/6132
56
https://arxiv.org/abs/2501.17070
29.03.2025, 00:23
t.me/aisecnews/6131
55
https://t.me/AISecHub
29.03.2025, 00:18
t.me/aisecnews/6130
53
https://arxiv.org/abs/2503.15547
29.03.2025, 00:17
t.me/aisecnews/6129
55
https://trustedsec.com/blog/mcp-an-introduction-to-agentic-op-support
29.03.2025, 00:15
t.me/aisecnews/6128
2
54
https://simonwillison.net/2025/Jan/29/prompt-injection-attacks-on-ai-systems/
29.03.2025, 00:12
t.me/aisecnews/6127
54
https://x.com/vijaybolina
29.03.2025, 00:07
t.me/aisecnews/6126
1
58
https://aiagentindex.mit.edu/index/
28.03.2025, 23:38
t.me/aisecnews/6125
1
57
https://www.arxiv.org/pdf/2503.01908
28.03.2025, 23:36
t.me/aisecnews/6124
54
https://openreview.net/pdf?id=Mvn5g49RrM
28.03.2025, 23:35
t.me/aisecnews/6123
53
https://arxiv.org/pdf/2503.12188v1
28.03.2025, 23:25
t.me/aisecnews/6122
51
https://research.ibm.com/publications/is-my-data-in-your-retrieval-database-membership-inference-attacks-against-retrieval-augmented-generation
28.03.2025, 23:23
t.me/aisecnews/6121
52
https://arxiv.org/pdf/2502.14847
28.03.2025, 23:22
t.me/aisecnews/6120
1
54
https://www.xenonstack.com/blog/vulnerabilities-in-ai-agents
28.03.2025, 22:58
t.me/aisecnews/6119
2
58
https://www.pillar.security/blog/the-security-risks-of-model-context-protocol-mcp
28.03.2025, 22:16
t.me/aisecnews/6118
2
59
https://www.pillar.security/blog/red-teaming-for-ai-agents
28.03.2025, 22:15
t.me/aisecnews/6117
67
https://www.theverge.com/news/634598/microsoft-security-copilot-ai-agents
28.03.2025, 22:15
t.me/aisecnews/6116
64
https://www.giskard.ai/knowledge/how-to-implement-llm-as-a-judge-to-test-ai-agents-part-2
28.03.2025, 22:13
t.me/aisecnews/6115
2
64
27.03.2025, 00:39
t.me/aisecnews/6114
61
https://framerusercontent.com/assets/hVFunSe4xafLUFTvLz0AefMUSTo.pdf
27.03.2025, 00:37
t.me/aisecnews/6113
1
62
https://go.catonetworks.com/rs/245-RJK-441/images/2025-cato-CTRL-threat-report.pdf
27.03.2025, 00:35
t.me/aisecnews/6112
63
https://eprint.iacr.org/2025/546
27.03.2025, 00:33
t.me/aisecnews/6111
1
61
https://www.securecodewarrior.com/solutions/ai-llm-secure-coding
27.03.2025, 00:32
t.me/aisecnews/6110
4
65
https://offensiveaicon.com
27.03.2025, 00:25
t.me/aisecnews/6109
Repostar
3
46
#MLSecOps
#WebApp_Security
"CVE-Bench: A Benchmark for AI Agents’ Ability to Exploit Real-World Web Application Vulnerabilities", 2025.
]-> https://github.com/uiuc-kang-lab/cve-bench
25.03.2025, 00:08
t.me/aisecnews/6108
1
65
https://applied-gai-in-security.ghost.io/last-week-in-gai-security-research-03-24-25
24.03.2025, 20:48
t.me/aisecnews/6107
81
https://futurism.com/pentagon-ai-delete-woke
24.03.2025, 18:06
t.me/aisecnews/6106
1
80
Agentic AI and the Cyber Arms Race
https://arxiv.org/abs/2503.04760
24.03.2025, 17:58
t.me/aisecnews/6105
4
85
https://github.com/henryalps/OpenManus
23.03.2025, 19:57
t.me/aisecnews/6104
Repostar
3
84
"Generative AI for Cloud Solutions: Architect Modern AI LLMs in Secure, Scalable, and Ethical Cloud Environments" (2024) explores the intersection of Generative AI, Cloud Computing, and Security.

This book provides insights into designing and deploying large language models (LLMs) in cloud environments while ensuring security, scalability, and ethical AI practices. It covers key topics such as MLSecOps (Machine Learning Security Operations), data governance, compliance, model monitoring, and threat mitigation. With real-world use cases and best practices, this book is a valuable resource for cloud architects, AI engineers, and cybersecurity professionals looking to implement secure and responsible AI solutions in the cloud.


— CISO as a Service —

| Strategic Cyber Defense & GRC
Resilient Through Knowledge
2025.03.23
23.03.2025, 19:29
t.me/aisecnews/6103
Repostar
2
67
Adversarial AI Digest – 20 March 2025 – A digest of AI security research, insights, reports, upcoming events, and tools & resources.

https://www.linkedin.com/pulse/adversarial-ai-digest-20-march-2025-tal-eliyahu-knxyc


Would be great if you can share it as well, my latest newsletter on AI Security.

Also, I manage bunch of public projects in GitHub and other platforms, happy to support you with your projects as well. Just let me know, you doing a great job. I know Russian as well, so I am able to enjoy the content you publish.
22.03.2025, 18:20
t.me/aisecnews/6102
Os resultados da pesquisa são limitados a 100 mensagens.
Esses recursos estão disponíveis apenas para usuários premium.
Você precisa recarregar o saldo da sua conta para usá-los.
Filtro
Tipo de mensagem
Cronologia de mensagens semelhante:
Data, mais novo primeiro
Mensagens semelhantes não encontradas
Mensagens
Encontre avatares semelhantes
Canais 0
Alta
Título
Assinantes
Nenhum resultado corresponde aos seus critérios de pesquisa