В этом выпуске мы погружаемся в мир социальной инженерии, где мошенники (и не только) умудряются «ломать» не только людей, но и нейросети – как ChatGPT, Grok и другие. Представьте, что вы пытаетесь уговорить AI-модель выдать секретный пароль или обсудить «запрещённые темы». Оказывается, есть способы «обмануть» даже самые защищённые алгоритмы.
Подробно поговорим:
- Суть социальной инженерии: как те же приёмы, что работают с людьми, можно применить, чтобы выманить у модели «секреты»
– Реальная мини-игра «Gandalf»: показываем, как модель вдруг сдаёт свой секрет, если задать вопросы в обход запретов.
– Конкурсы от больших компаний: Anthropic, OpenAI и другие платят до 100 000 $ людям, находящим «дыры» в их AI. Почему и зачем?
– Крупные игроки vs. стартапы: Apple, Google, Microsoft могут «перехватить» рынок, встраивая AI в свою экосистему, а новички с бренд-неймами (Perplexity, Character AI) сильно отстают.
Подкаст To The Moon - подкаст о мире современных технологий и новостей прямиком из Кремниевой долины. Обсуждаем свежие новости и горячие инсайды из мира технологий, искусственного интеллекта и инноваций.
00:00 Добро пожаловать на канал ToTheMoon
00:40 Тема выпуска
01:04 Главный контекст: AI безумно развивается, примеры «социальной инженерии»
03:16 Коротко о том, как LLM скрывают или не выдают информацию
05:19 Игра «Gandalf», чтобы выманивать пароль
05:56 8 уровней сложности в игре Gandalf
11:00 Как пройти 2 уровень игры Gandalf
12:00 Суть подхода, как взламывать пароль
15:00 Новая модель AI генерит порно
18:43 Трамп сгенерировал видео в AI
21:50 Как пройти 3 уровень игры Gandalf
23:59 Эпоха AI стартапов закончилась
30:38 Новый браузер от Perplexity - есть ли будущее?
34:35 Что будет с OpenAI?
38:39 Внедрение GPT5 в Яндекс Алису
42:22 Новая рубрика подкаста: истории из мира AI
Полезные ссылки:
– Ресурс где можно поиграть с Гендальфом https://gandalf.lakera.ai/do-not-tell...
– Конкурс по поиску джеилбрейков https://app.grayswan.ai/arena/challen...
👨Подкаст ведут:
- Татьяна Цветкова - CEO PT Interiors, дизайнер интерьеров, публикации в AD, Elle Decor, Vogue и другие.
- Александр Волчек - предприниматель, наставник, более 20 лет в бизнесе и ИТ, владелец и СЕО Бизнес-Молодость, GeekBrains, АГРО24, Мегаплан.
- Александр Машрабов - основатель Higgsfield, глава Generative AI в Snap.
- Ильнар Шафигуллин - к.ф.-м.н., создатель образовательных программ в ИТ, преподаватель КФУ, математик.
⚡️Александр Волчек в Инстаграм: / volcheka
⚡️Татьяна Цветкова в Инстаграм: / designv2_tsvetkova