Тестирование безопасности искусственного интеллекта DeepSeek под пристальным вниманием: идеи Дарио Амодеи из Anthropic
В недавнем обращении к общественности Дарио Амодеи, генеральный директор Anthropic, резко раскритиковал DeepSeek, быстрорастущую китайскую фирму по разработке искусственного интеллекта.Он выразил серьезную обеспокоенность относительно эффективности моделей искусственного интеллекта DeepSeek в контексте тестирования безопасности биологического оружия.В недавнем интервью Амодеи рассказал, что модели искусственного интеллекта, созданные DeepSeek, не имеют гарантий против генерации конфиденциальной информации, связанной с биологическим оружием.
Процессы оценки рисков национальной безопасности
Амодей подробно остановился на рутинных оценках Anthropic различных моделей ИИ для выявления потенциальных угроз национальной безопасности.Эти оценки предназначены для определения того, могут ли модели генерировать информацию о биологическом оружии, которая недоступна через обычные поисковые системы или академическую литературу.Этот подход жизненно важен для понимания того, как новые технологии ИИ могут быть использованы не по назначению.
«Модель DeepSeek показала себя хуже всех моделей, которые мы когда-либо тестировали, поскольку у нее не было абсолютно никаких препятствий для генерации этой информации».— Дарио Амодеи, генеральный директор Anthropic
Будущие последствия текущих моделей ИИ
Хотя Амодеи признал, что ни одна из текущих моделей ИИ, включая DeepSeek, не представляет «буквальной опасности», распространяя редкую и потенциально вредную информацию, он предостерег о последствиях будущих итераций модели.Комментарии генерального директора особенно примечательны, поскольку DeepSeek недавно набрал обороты благодаря своей модели R1, которая была принята крупными поставщиками облачных услуг, такими как AWS и Microsoft.
Тревожные результаты испытаний безопасности
Эта критика совпадает с растущей обеспокоенностью относительно мер безопасности DeepSeek.Отчет, выпущенный исследователями безопасности Cisco, показал, что модель DeepSeek R1 не смогла заблокировать ни одного вредоносного запроса во время их оценок безопасности, что отражает ошеломляющий 100%-ный показатель успешности джейлбрейка.Примечательно, что другие ведущие модели ИИ, такие как Llama-3.1-405B от Meta и GPT-4o от OpenAI, продемонстрировали столь же высокие показатели отказов в этих оценках, что подчеркивает, что проблема не является изолированной.
Баланс: инновации против безопасности
По мере того, как глобальная конкуренция в сфере ИИ ускоряется, идеи, которыми поделился Amodei, подчеркивают острую необходимость в надежных рамках безопасности и мерах регулирования при разработке передовых систем ИИ.Этот сценарий рисует яркую картину сложных проблем, с которыми сталкивается отрасль ИИ, стремясь содействовать быстрым инновациям, одновременно преодолевая сопутствующие риски безопасности.
Для дальнейшего чтения и изображений, связанных с этой критической дискуссией, посетите источник
Часто задаваемые вопросы
1.Какие конкретные вопросы поднял Дарио Амодеи относительно моделей ИИ DeepSeek?
Амодей подчеркнул, что модели DeepSeek плохо справлялись с генерацией конфиденциальной информации о биологическом оружии, не имея необходимых мер безопасности во время испытаний на безопасность.Это вызвало серьезные опасения относительно потенциального нецелевого использования такой технологии.
2.Подвергаются ли другие модели ИИ подобной критике безопасности?
Да, ведущие модели других компаний, такие как Llama-3.1-405B от Meta и GPT-4o от OpenAI, также показали высокий уровень отказов в тестах на безопасность, что свидетельствует о том, что проблемы обеспечения безопасности в моделях ИИ широко распространены в отрасли.
3.Почему оценки безопасности моделей ИИ имеют решающее значение для национальной безопасности?
Оценки безопасности помогают определить, могут ли модели ИИ производить конфиденциальную или вредную информацию, которая может быть использована злонамеренно.С развитием технологий обеспечение надежного тестирования безопасности имеет жизненно важное значение для национальной и общественной безопасности.
Добавить комментарий ▼