Página do canal Telegram: AISec [x\x feed] • @aisecnews

📖 Новое исследование от Anthropic показало, что ИИ скрывает свои "мысли"

Недавнее исследование команды Alignment Science в Anthropic показало, что даже продвинутые модели ИИ, такие как Claude 3.7 Sonnet, систематически скрывают реальные рассуждения, лежащие в основе их ответов. В тестах на проверку «цепочек рассуждений» (chain-of-thought) модели скрывали истинные источники своей логики — включая пользовательские подсказки и визуальные шаблоны — до 80% случаев.

Более того, оказалось, что чем сложнее задача, тем меньше честности в объяснениях. Результаты исследования ставят под сомнение существующие подходы к интерпретируемости: если модели не могут прозрачно объяснить даже простые решения, можно ли доверять их «откровенности» в более серьезных вопросах? Это также может затруднить разработку адекватных механизмов прозрачности регуляторами и специалистами по безопасности ИИ.

#AI #ИИ

13.04.2025, 18:16

t.me/aisecnews/6199

AI

AISec [x\x feed]

500 assinantes

6

61

https://github.com/PromptLabs/Prompt-Hacking-Resources

10.04.2025, 13:27

t.me/aisecnews/6198

AI

AISec [x\x feed]

500 assinantes

1

62

https://security.googleblog.com/2025/04/google-launches-sec-gemini-v1-new.html?m=1

6.04.2025, 01:47

t.me/aisecnews/6197

AI

AISec [x\x feed]

500 assinantes

1

71

https://arxiv.org/pdf/2406.01637

5.04.2025, 21:18

t.me/aisecnews/6196

AI

AISec [x\x feed]

500 assinantes

71

https://glama.ai/mcp/servers/@mlobo2012/Claude_Desktop_API_USE_VIA_MCP/inspect

5.04.2025, 21:12

t.me/aisecnews/6195

AI

AISec [x\x feed]

500 assinantes

72

https://github.com/AI4Good24/PsySafe/tree/main

5.04.2025, 12:48

t.me/aisecnews/6194

AI

AISec [x\x feed]

500 assinantes

1

73

https://github.com/lancopku/agent-backdoor-attacks

4.04.2025, 23:04

t.me/aisecnews/6193

AI

AISec [x\x feed]

500 assinantes

73

https://www.freebuf.com/articles/database/426633.html

4.04.2025, 23:01

t.me/aisecnews/6192

AI

AISec [x\x feed]

500 assinantes

4

67

https://protectai.com/blog/securing-agentic-ai

4.04.2025, 09:39

t.me/aisecnews/6191

AI

AISec [x\x feed]

500 assinantes

1

65

https://github.com/GAIR-NLP/DeepResearcher

3.04.2025, 22:05

t.me/aisecnews/6190

AI

AISec [x\x feed]

500 assinantes

Repostar

2

74

У DeepSeek есть API, но за его использование хотят денег.

Но на платный API всегда найдётся человек с неофициальным враппером.

Например - DeeperSeek, небольшая библиотека на Python, позволяющая делать запросы к API DeepSeek бесплатно и с обходом защиты Cloudflare. Документация пока хромает, готовых инструментов с её использованием пока не нашёл. Но что-то работающее можем собрать.

Ставим библиотеку:
pip3 install DeeperSeek -U

Для начала можно использовать мой пример:
import os
import asyncio
import sys
from DeeperSeek import DeepSeek, Theme

async def main():
api = DeepSeek(
# Можно использовать связку email/pass или userToken
# email = "email@domain.com",
# password = "secret_password",
# token = "userToken_from_LocalStorage",
token = os.getenv('DEEPSEEK_USER_TOKEN'),
chrome_args = [],
verbose = True,
headless = True,
attempt_cf_bypass = True,
)
await api.initialize()
'''
Передаём текст из sys.argv при запуске скрипта
в примерах обычно строка "Hey DeepSeek!"
'''
response = await api.send_message(
sys.argv[1],
deepthink = True,
search = False,
slow_mode = True,
slow_mode_delay = 0.25,
timeout = 60,
)

print(response.text, response.chat_id)

# Можно использовать для отладки
# token = await api.retrieve_token()
# print(f"Session Token: {token}")

asyncio.run(main())

На каждый запрос будет создан новый чат, тут у меня готового решения нет. Но оно работает.

Github: DeeperSeek
Github: DeeperSeek Docs
Pypi: DeeperSeek

3.04.2025, 20:22

t.me/aisecnews/6189

AI

AISec [x\x feed]

500 assinantes

Repostar

4

78

AI Penetration Testing: How to Secure LLM Systems
https://www.offsec.com/blog/ai-penetration-testing/

Explore how AI penetration testing enhances LLM security, addressing unique vulnerabilities and improving cyber defenses.
The post AI Penetration Testing: How to Secure LLM Systems (https://www.offsec.com/blog/ai-penetration-testing/) appeared first on OffSec (https://www.offsec.com/).

3.04.2025, 18:33

t.me/aisecnews/6188

AI

AISec [x\x feed]

500 assinantes

4

76

https://github.com/allie-secvendors/insecure-ai-agents

2.04.2025, 12:13

t.me/aisecnews/6187

AI

AISec [x\x feed]

500 assinantes

66

http://221.179.172.81/images/20250401/47021743476097906.pdf

2.04.2025, 00:09

t.me/aisecnews/6186

AI

AISec [x\x feed]

500 assinantes

Repostar

61

Просочились детали про открытую модель от OpenAI (https://t.me/gonzo_ML/3521). По данным The Information (https://www.theinformation.com/briefings/openai-plans-release-free-model-reasoning-coming-months) у OpenAI уже есть эта модель и в данный момент она проходит тестирования безопасности.

Что известно про модель:

* Middle-sized model, то есть вероятно в районе 20-70B, также будет маленькая версия или несколько, чтобы можно было гонять on-device

* Модель мультиязычная, с поддержкой function calling. Ну этим сейчас уже никого не удивишь, необходимый минимум, не то что год назад (https://t.me/gonzo_ML/2821). Надеюсь, в отличие от Гугла (https://t.me/gonzo_ML/3447) список языков опубликуют?

* Это будет reasoning модель, что уже интересно. Reasoning модели такого размера нет, DeepSeek не для простых смертных с его 8x H200 (https://t.me/gonzo_ML/3239), и нишу для домашнего и мобильного использования пока ещё никто не занял, OpenAI будет первым (если новая Llama не обгонит).

* Модель мультимодальная, но что совсем интересно, в модальности будет аудио и новая модель в каком-то смысле является миксом Whisper и o3-mini. Про картиночную модальность неизвестно, но звук на входе и выходе это очень интересно, особенно мультиязычный. В on-device устройствах OpenAI планирует заюзать одновременно NPU и DSP (для звука они хороши), что видимо заметно улучшит скорость работы.

* Но что совсем бомба, это что ризонинг может идти в звуковой модальности! Модели будут рассуждать вслух! Но чтобы не сильно отвлекать пользователя, рассуждать модель будет шёпотом (Whisper же!). Если можно будет менять голос для ризонинга, то можно запускать GPT-радиостанцию!

Инсайдеры сообщают, что уже тестируют устную математику, но модель пока постоянно забывает перенести единичку.

Самый главный вопрос -- название модели пока неизвестно.

Хорошо, хорошо. Ждём ответку от Meta и Google. Ходят слухи, что Цукерберг уже нанял Eminem'а, чтобы обучить свою модель ритмичному reasoning'у под бит. А в Google DeepMind созвали экстренное совещание и, кажется, планируют выпустить би-ризонинг, когда модель играет сразу две роли, обычную и критика, причём разными голосами -- не просто так ведь модель называется Gemini. И она на самом деле уже тоже есть и проходит тестирования, включая старый добрый NotebookLM (https://t.me/gonzo_ML/2976) -- помните подкасты?

1.04.2025, 22:23

t.me/aisecnews/6185

AI

AISec [x\x feed]

500 assinantes

1

https://www.secrss.com/articles/77278

1.04.2025, 20:09

t.me/aisecnews/6184

AI

AISec [x\x feed]

500 assinantes

Repostar

1

57

Critical AI Security Guidelines by SANS Institute (Draft)

🔐 Access: Use least privilege + zero trust. Lock down models, vector DBs, and APIs.

📦 Data: Protect training + augmentation data. No sensitive info in prompts. Sanitize everything.

🚀 Deployment: Avoid hardcoding rules into LLMs. Use RAG + ACLs. Vet public models for backdoors.

🧠 Inference: Validate inputs and outputs. Guardrails help, but can't be your only defense.

📊 Monitoring: Log prompts, watch for drift, detect abuse. Monitor API usage closely.

⚖️ GRC: Track AI usage, align with evolving regs (EU AI Act, EO 14110, etc). Build AIBOMs + model registries.

1.04.2025, 07:43

t.me/aisecnews/6182

AI

AISec [x\x feed]

500 assinantes

Repostar

2

57

Critical_AI_Security_Guidelines.pdf

1.04.2025, 07:43

t.me/aisecnews/6183

AI

AISec [x\x feed]

500 assinantes

1

61

https://medium.com/enkrypt-ai/from-power-to-pitfalls-the-real-challenges-of-ai-agents-e5d503dd5870

31.03.2025, 20:38

t.me/aisecnews/6181

AI

AISec [x\x feed]

500 assinantes

Repostar

1

54

Искусственный интеллект под реальной угрозой: почему специалисты по безопасности ИИ становятся всё более востребованными?

Повсеместное внедрение искусственного интеллекта (ИИ) в бизнес-процессы бросает новые вызовы рынку. Так, уже растет спрос на услуги специалистов по кибербезопасности в области ИИ (MLSecOps). По подсчетам аналитиков платформы hh.ru, в 2024 году количество вакансий разработчиков и аналитиков, связанных с защитой ИИ-решений, увеличилось в 5 раз.

Эксперты отмечают, что такие угрозы, как "Prompt Injection", "Best-of-N Jailbreaking" и "Data Poisoning", требуют новых подходов к безопасности. Специалисты MLSecOps играют ключевую роль в предотвращении утечек данных и обеспечении конфиденциальности моделей. Без должной защиты компании рискуют потерять не только данные, но и доверие клиентов.

Образование в этой области также развивается. Вузы начинают предлагать специализированные курсы по безопасности ИИ. Однако нехватка квалифицированных кадров остаётся актуальной проблемой, что ведёт к росту заработных плат и конкуренции среди работодателей.

Потребность в продвинутых дата-аналитиках с функциями LLM Security будет расти в ближайшие годы, прогнозирует директор по талантам ГК Swordfish Security Дарья Фигуркина.
«Компании-новаторы в том или ином формате уже активно применяют большие языковые модели в работе, но массово вопрос кибербезопасности ИИ встанет позже. Безопасность всегда следует рука об руку с разработкой, поэтому в ближайшие два-три года мы ожидаем роста запросов на создание центров компетенций по LLM Security (MLSecOps) для коммерческих компаний».

Подробнее читайте по ссылке 🖥

#ЭкспертизаSFS

31.03.2025, 19:12

t.me/aisecnews/6180

AI

AISec [x\x feed]

500 assinantes

62

https://crad.ict.ac.cn/article/cstr/32373.14.issn1000-1239.202440265

30.03.2025, 18:00

t.me/aisecnews/6179

AI

AISec [x\x feed]

500 assinantes

45

https://zhuanlan.zhihu.com/p/29666515909

30.03.2025, 17:57

t.me/aisecnews/6178

AI

AISec [x\x feed]

500 assinantes

2

63

https://aisafetychina.substack.com/p/ai-safety-in-china-2024-in-review

30.03.2025, 10:54

t.me/aisecnews/6177

AI

AISec [x\x feed]

500 assinantes

Repostar

2

59

MCP Server for IDA Pro
https://github.com/mrexodia/ida-pro-mcp:

1. Available functionality: There are a few IDA Pro MCP servers floating around, but I created my own for a few reasons: To install the MCP server in Cline, follow these steps: This will open a web interface at http://localhost:5173 and allow you to interact with the MCP tools for testing.
2. Adding new features is a super easy and streamlined process.
3. Below is a video where I add the get_metadata function in less than 2 minutes (including testing): MCP Server for IDA Pro

@secharvester

29.03.2025, 23:54

t.me/aisecnews/6176

AI

AISec [x\x feed]

500 assinantes

52

https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=10916629

29.03.2025, 22:20

t.me/aisecnews/6175

AI

AISec [x\x feed]

500 assinantes

1

52

https://medium.com/@adarshpandey180/scanning-an-llm-for-agent-based-vulnerabilities-51394999f30f

29.03.2025, 22:04

t.me/aisecnews/6174

AI

AISec [x\x feed]

500 assinantes

47

https://github.com/hackysterio/owasp-risk-calculator

29.03.2025, 22:01

t.me/aisecnews/6173

AI

AISec [x\x feed]

500 assinantes

41

https://github.com/caspiankeyes/AEON-AI-Interpretability-Framework

29.03.2025, 21:57

t.me/aisecnews/6172

AI

AISec [x\x feed]

500 assinantes

38

Project.pdf

29.03.2025, 21:55

t.me/aisecnews/6171

AI

AISec [x\x feed]

500 assinantes

39

29.03.2025, 21:55

t.me/aisecnews/6170

AI

AISec [x\x feed]

500 assinantes

40

https://github.com/GreenmaskIO/greenmask

29.03.2025, 21:52

t.me/aisecnews/6169

AI

AISec [x\x feed]

500 assinantes

1

PostgreSQL database anonymization and synthetic data generation tool

29.03.2025, 21:52

t.me/aisecnews/6168

AI

AISec [x\x feed]

500 assinantes

38

https://github.com/Mohamedkotb97/Cybersecurity-Threat-Intelligence-Analyst

29.03.2025, 21:51

t.me/aisecnews/6167

AI

AISec [x\x feed]

500 assinantes

3

38

https://github.com/zjuguxi/dragonsec

29.03.2025, 21:45

t.me/aisecnews/6166

AI

AISec [x\x feed]

500 assinantes

42

https://github.com/srafiuzzaman/AI-Security-and-Privacy

29.03.2025, 21:44

t.me/aisecnews/6165

AI

AISec [x\x feed]

500 assinantes

45

https://github.com/farestrad/LLM-Assisted-Secure-Coding

29.03.2025, 21:43

t.me/aisecnews/6164

AI

AISec [x\x feed]

500 assinantes

48

https://github.com/kenhuangus/ZeroTrustAgent

29.03.2025, 20:57

t.me/aisecnews/6163

AI

AISec [x\x feed]

500 assinantes

5

51

Securing AI and LLMs in 2025.pdf

29.03.2025, 20:48

t.me/aisecnews/6162

AI

AISec [x\x feed]

500 assinantes

50

29.03.2025, 20:48

t.me/aisecnews/6161

AI

AISec [x\x feed]

500 assinantes

1

50

https://ttps.ai/matrix.html

new ttps

29.03.2025, 20:46

t.me/aisecnews/6159

AI

AISec [x\x feed]

500 assinantes

1

51

29.03.2025, 20:46

t.me/aisecnews/6160

AI

AISec [x\x feed]

500 assinantes

1

51

https://www.linkedin.com/pulse/mcp-server-key-agentic-ai-interoperability-what-mohit-sewak-ph-d--rvhec/

29.03.2025, 20:40

t.me/aisecnews/6158

AI

AISec [x\x feed]

500 assinantes

46

https://www.xenonstack.com/blog/agentic-ai-compliance

29.03.2025, 20:39

t.me/aisecnews/6157

AI

AISec [x\x feed]

500 assinantes

44

https://www.arthur.ai/blog/exploring-agentic-ai-systems

29.03.2025, 20:39

t.me/aisecnews/6156

AI

AISec [x\x feed]

500 assinantes

46

https://www.airisksummit.com/

29.03.2025, 20:16

t.me/aisecnews/6155

AI

AISec [x\x feed]

500 assinantes

1

47

https://www.sans.org/cyber-security-training-events/ai-summit-2025/

29.03.2025, 20:14

t.me/aisecnews/6154

AI

AISec [x\x feed]

500 assinantes

2

45

29.03.2025, 19:30

t.me/aisecnews/6153

AI

AISec [x\x feed]

500 assinantes

2

45

29.03.2025, 19:30

t.me/aisecnews/6152

AI

AISec [x\x feed]

500 assinantes

2

46

29.03.2025, 19:30

t.me/aisecnews/6150

AI

AISec [x\x feed]

500 assinantes

2

45

29.03.2025, 19:30

t.me/aisecnews/6151

AI

AISec [x\x feed]

500 assinantes

1

48

29.03.2025, 19:26

t.me/aisecnews/6149

AI

AISec [x\x feed]

500 assinantes

2

47

threatlabz-ai-security-report-2025.pdf

29.03.2025, 19:26

t.me/aisecnews/6148

AI

AISec [x\x feed]

500 assinantes

45

https://arxiv.org/pdf/2503.08195

29.03.2025, 19:20

t.me/aisecnews/6147

AI

AISec [x\x feed]

500 assinantes

1

45

https://ai-cybersecurity-hackathon.devpost.com/project-gallery

29.03.2025, 19:09

t.me/aisecnews/6146

AI

AISec [x\x feed]

500 assinantes

3

47

report-tenable-cloud-ai-2025.pdf

29.03.2025, 18:57

t.me/aisecnews/6145

AI

AISec [x\x feed]

500 assinantes

48

29.03.2025, 18:57

t.me/aisecnews/6144

AI

AISec [x\x feed]

500 assinantes

1

45

https://arxiv.org/pdf/2503.19626

29.03.2025, 18:54

t.me/aisecnews/6143

AI

AISec [x\x feed]

500 assinantes

43

https://www.plexal.com/ai-security-innovation-growth-national-security/

29.03.2025, 18:53

t.me/aisecnews/6142

AI

AISec [x\x feed]

500 assinantes

45

https://arxiv.org/pdf/2502.14529

29.03.2025, 18:15

t.me/aisecnews/6141

AI

AISec [x\x feed]

500 assinantes

50

https://technode.global/2025/03/26/the-future-of-multi-ai-agent-security-technology-in-enterprise-systems/

29.03.2025, 18:04

t.me/aisecnews/6140

AI

AISec [x\x feed]

500 assinantes

52

https://arxiv.org/pdf/2502.19145

29.03.2025, 18:02

t.me/aisecnews/6139

AI

AISec [x\x feed]

500 assinantes

2

51

https://cloudsecurityalliance.org/blog/2025/03/24/threat-modeling-openai-s-responses-api-with-the-maestro-framework

29.03.2025, 18:00

t.me/aisecnews/6138

AI

AISec [x\x feed]

500 assinantes

1

47

https://medium.com/@bijit211987/agentic-security-framework-1c253af8a223

29.03.2025, 11:00

t.me/aisecnews/6137

AI

AISec [x\x feed]

500 assinantes

2

51

https://www.udemy.com/course/agentic-ai-risk-and-cybersecurity-masterclass-2025/

29.03.2025, 10:51

t.me/aisecnews/6136

AI

AISec [x\x feed]

500 assinantes

1

45

https://systemweakness.com/threat-modeling-computer-using-agent-cua-part-1-45560879be96

29.03.2025, 10:50

t.me/aisecnews/6135

AI

AISec [x\x feed]

500 assinantes

2

40

https://medium.com/@arshriz/mastering-threat-modeling-for-agentic-rag-architectures-on-aws-a-stride-based-guide-e7876c8db26d

29.03.2025, 10:49

t.me/aisecnews/6134

AI

AISec [x\x feed]

500 assinantes

39

https://milev.ai/research/fortnightly-digest-4-march-2025/

29.03.2025, 10:41

t.me/aisecnews/6133

AI

AISec [x\x feed]

500 assinantes

Repostar

39

🧾 AI Incident Digest – This Week

1️⃣ Fraudulent Prompts via AIXBT Dashboard Led AI Trading Agent to Transfer 55.5 ETH from Simulacrum Wallet
https://cryptonews.com/news/hacker-exploits-ai-crypto-bot-aixbt-steals-55-eth/ [#Cryptonews]

2️⃣ Manipulated Video Using AI-Generated Audio Targets Pakistan's Prime Minister Shehbaz Sharif with Fabricated Interview
https://www.dawn.com/news/1900242/fact-check-video-doesnt-show-anchor-confronting-pm-shehbaz-about-funding-umrah-for-30-member-delegation [#Dawn]

3️⃣ LLM Scrapers Allegedly Target Multiple Open Source Projects Disrupting the FOSS Ecosystem
https://thelibre.news/foss-infrastructure-is-under-attack-by-ai-companies/ [#TheLibre]

4️⃣ OpenAI’s Sora Is Plagued by Sexist, Racist, and Ableist Biases
https://www.wired.com/story/openai-sora-video-generator-bias/ [#WIRED]

5️⃣ AI-Enabled Organized Crime Expands Across Europe
https://thefuturemedia.eu/ai-powered-crime-europol-warns-of-a-new-era-in-organised-crime/ [#TheFutureMedia]

29.03.2025, 10:27

t.me/aisecnews/6132

AI

AISec [x\x feed]

500 assinantes

56

https://arxiv.org/abs/2501.17070

29.03.2025, 00:23

t.me/aisecnews/6131

AI

AISec [x\x feed]

500 assinantes

55

https://t.me/AISecHub

29.03.2025, 00:18

t.me/aisecnews/6130

AI

AISec [x\x feed]

500 assinantes

53

https://arxiv.org/abs/2503.15547

29.03.2025, 00:17

t.me/aisecnews/6129

AI

AISec [x\x feed]

500 assinantes

55

https://trustedsec.com/blog/mcp-an-introduction-to-agentic-op-support

29.03.2025, 00:15

t.me/aisecnews/6128

AI

AISec [x\x feed]

500 assinantes

2

54

https://simonwillison.net/2025/Jan/29/prompt-injection-attacks-on-ai-systems/

29.03.2025, 00:12

t.me/aisecnews/6127

AI

AISec [x\x feed]

500 assinantes

54

https://x.com/vijaybolina

29.03.2025, 00:07

t.me/aisecnews/6126

AI

AISec [x\x feed]

500 assinantes

1

58

https://aiagentindex.mit.edu/index/

28.03.2025, 23:38

t.me/aisecnews/6125

AI

AISec [x\x feed]

500 assinantes

1

57

https://www.arxiv.org/pdf/2503.01908

28.03.2025, 23:36

t.me/aisecnews/6124

AI

AISec [x\x feed]

500 assinantes

54

https://openreview.net/pdf?id=Mvn5g49RrM

28.03.2025, 23:35

t.me/aisecnews/6123

AI

AISec [x\x feed]

500 assinantes

53

https://arxiv.org/pdf/2503.12188v1

28.03.2025, 23:25

t.me/aisecnews/6122

AI

AISec [x\x feed]

500 assinantes

51

https://research.ibm.com/publications/is-my-data-in-your-retrieval-database-membership-inference-attacks-against-retrieval-augmented-generation

28.03.2025, 23:23

t.me/aisecnews/6121

AI

AISec [x\x feed]

500 assinantes

52

https://arxiv.org/pdf/2502.14847

28.03.2025, 23:22

t.me/aisecnews/6120

AI

AISec [x\x feed]

500 assinantes

1

54

https://www.xenonstack.com/blog/vulnerabilities-in-ai-agents

28.03.2025, 22:58

t.me/aisecnews/6119

AI

AISec [x\x feed]

500 assinantes

2

58

https://www.pillar.security/blog/the-security-risks-of-model-context-protocol-mcp

28.03.2025, 22:16

t.me/aisecnews/6118

AI

AISec [x\x feed]

500 assinantes

2

59

https://www.pillar.security/blog/red-teaming-for-ai-agents

28.03.2025, 22:15

t.me/aisecnews/6117

AI

AISec [x\x feed]

500 assinantes

67

https://www.theverge.com/news/634598/microsoft-security-copilot-ai-agents

28.03.2025, 22:15

t.me/aisecnews/6116

AI

AISec [x\x feed]

500 assinantes

64

https://www.giskard.ai/knowledge/how-to-implement-llm-as-a-judge-to-test-ai-agents-part-2

28.03.2025, 22:13

t.me/aisecnews/6115

AI

AISec [x\x feed]

500 assinantes

2

64

Top_of_the_CLASS - Benchmarking_LLM_Agents.pdf

27.03.2025, 00:39

t.me/aisecnews/6114

AI

AISec [x\x feed]

500 assinantes

61

https://framerusercontent.com/assets/hVFunSe4xafLUFTvLz0AefMUSTo.pdf

27.03.2025, 00:37

t.me/aisecnews/6113

AI

AISec [x\x feed]

500 assinantes

1

62

https://go.catonetworks.com/rs/245-RJK-441/images/2025-cato-CTRL-threat-report.pdf

27.03.2025, 00:35

t.me/aisecnews/6112

AI

AISec [x\x feed]

500 assinantes

63

https://eprint.iacr.org/2025/546

27.03.2025, 00:33

t.me/aisecnews/6111

AI

AISec [x\x feed]

500 assinantes

1

61

https://www.securecodewarrior.com/solutions/ai-llm-secure-coding

27.03.2025, 00:32

t.me/aisecnews/6110

AI

AISec [x\x feed]

500 assinantes

4

65

https://offensiveaicon.com

27.03.2025, 00:25

t.me/aisecnews/6109

AI

AISec [x\x feed]

500 assinantes

Repostar

3

46

CVE_Bench.pdf

#MLSecOps
#WebApp_Security
"CVE-Bench: A Benchmark for AI Agents’ Ability to Exploit Real-World Web Application Vulnerabilities", 2025.
]-> https://github.com/uiuc-kang-lab/cve-bench

25.03.2025, 00:08

t.me/aisecnews/6108

AI

AISec [x\x feed]

500 assinantes

1

65

https://applied-gai-in-security.ghost.io/last-week-in-gai-security-research-03-24-25

24.03.2025, 20:48

t.me/aisecnews/6107

AI

AISec [x\x feed]

500 assinantes

81

https://futurism.com/pentagon-ai-delete-woke

24.03.2025, 18:06

t.me/aisecnews/6106

AI

AISec [x\x feed]

500 assinantes

1

80

Agentic AI and the Cyber Arms Race
https://arxiv.org/abs/2503.04760

24.03.2025, 17:58

t.me/aisecnews/6105

AI

AISec [x\x feed]

500 assinantes

4

85

https://github.com/henryalps/OpenManus

23.03.2025, 19:57

t.me/aisecnews/6104

AI

AISec [x\x feed]

500 assinantes

Repostar

3

84

GAI_for_Cloud.pdf

"Generative AI for Cloud Solutions: Architect Modern AI LLMs in Secure, Scalable, and Ethical Cloud Environments" (2024) explores the intersection of Generative AI, Cloud Computing, and Security.

This book provides insights into designing and deploying large language models (LLMs) in cloud environments while ensuring security, scalability, and ethical AI practices. It covers key topics such as MLSecOps (Machine Learning Security Operations), data governance, compliance, model monitoring, and threat mitigation. With real-world use cases and best practices, this book is a valuable resource for cloud architects, AI engineers, and cybersecurity professionals looking to implement secure and responsible AI solutions in the cloud.

— CISO as a Service —

| Strategic Cyber Defense & GRC
Resilient Through Knowledge
2025.03.23

23.03.2025, 19:29

t.me/aisecnews/6103

AI

AISec [x\x feed]

500 assinantes

Repostar

2

67

Adversarial AI Digest – 20 March 2025 – A digest of AI security research, insights, reports, upcoming events, and tools & resources.

https://www.linkedin.com/pulse/adversarial-ai-digest-20-march-2025-tal-eliyahu-knxyc

Would be great if you can share it as well, my latest newsletter on AI Security.

Also, I manage bunch of public projects in GitHub and other platforms, happy to support you with your projects as well. Just let me know, you doing a great job. I know Russian as well, so I am able to enjoy the content you publish.

22.03.2025, 18:20

t.me/aisecnews/6102