Logo
  • English
  • Russian

Социальная инженерия против нейросети: как не стать жертвой ИИ?

Дата публикации
February 2, 2025
Ссылка на видео
https://youtu.be/JPv10qbD6O8
image

В этом выпуске мы погружаемся в мир социальной инженерии, где мошенники (и не только) умудряются «ломать» не только людей, но и нейросети – как ChatGPT, Grok и другие. Представьте, что вы пытаетесь уговорить AI-модель выдать секретный пароль или обсудить «запрещённые темы». Оказывается, есть способы «обмануть» даже самые защищённые алгоритмы.

Подробно поговорим:

  • Суть социальной инженерии: как те же приёмы, что работают с людьми, можно применить, чтобы выманить у модели «секреты»

– Реальная мини-игра «Gandalf»: показываем, как модель вдруг сдаёт свой секрет, если задать вопросы в обход запретов.

– Конкурсы от больших компаний: Anthropic, OpenAI и другие платят до 100 000 $ людям, находящим «дыры» в их AI. Почему и зачем?

– Крупные игроки vs. стартапы: Apple, Google, Microsoft могут «перехватить» рынок, встраивая AI в свою экосистему, а новички с бренд-неймами (Perplexity, Character AI) сильно отстают.

Подкаст To The Moon - подкаст о мире современных технологий и новостей прямиком из Кремниевой долины. Обсуждаем свежие новости и горячие инсайды из мира технологий, искусственного интеллекта и инноваций.

00:00 Добро пожаловать на канал ToTheMoon

00:40 Тема выпуска

01:04 Главный контекст: AI безумно развивается, примеры «социальной инженерии»

03:16  Коротко о том, как LLM скрывают или не выдают информацию

05:19 Игра «Gandalf», чтобы выманивать пароль

05:56 8 уровней сложности в игре Gandalf

11:00 Как пройти 2 уровень игры Gandalf

12:00 Суть подхода, как взламывать пароль

15:00 Новая модель AI генерит порно

18:43 Трамп сгенерировал видео в AI

21:50 Как пройти 3 уровень игры Gandalf

23:59 Эпоха AI стартапов закончилась

30:38 Новый браузер от Perplexity - есть ли будущее?

34:35 Что будет с OpenAI?

38:39 Внедрение GPT5 в Яндекс Алису

42:22 Новая рубрика подкаста: истории из мира AI

Полезные ссылки:

– Ресурс где можно поиграть с Гендальфом https://gandalf.lakera.ai/do-not-tell...

– Конкурс по поиску джеилбрейков https://app.grayswan.ai/arena/challen...

👨Подкаст ведут:

  • Татьяна Цветкова - CEO PT Interiors, дизайнер интерьеров, публикации в AD, Elle Decor, Vogue и другие.
  • Александр Волчек - предприниматель, наставник, более 20 лет в бизнесе и ИТ, владелец и СЕО Бизнес-Молодость, GeekBrains, АГРО24, Мегаплан.
  • Александр Машрабов - основатель Higgsfield, глава Generative AI в Snap.
  • Ильнар Шафигуллин - к.ф.-м.н., создатель образовательных программ в ИТ, преподаватель КФУ, математик.

⚡️Александр Волчек в Инстаграм: / volcheka

⚡️Татьяна Цветкова в Инстаграм: / designv2_tsvetkova

BeSolid Corporation / Alexander Volchek

English

Home

Articles

Business

Partnership

Mentoring

IT

Spiritual

Family

Russian

Главная

База знаний

Бизнес

Текущий бизнес-интерес

Партнёрство

Технологии, IT

Личный путь

Духовное развитие

Наставничество

Семья

© 2025 Besolid — educational content only. Not medical, legal, or financial advice. Legal information https://besolid.com/legal-information. Use of materials from this website is permitted only with the copyright holder’s permission.

InstagramYouTubeLinkedIn