Главният изпълнителен директор на Anthropic разкрива провала на DeepSeek AI в решаващия тест за безопасност на биооръжията

Тестовете за безопасност на AI на DeepSeek под наблюдение: Прозрения от Дарио Амодей от Anthropic

В скорошно обръщение към обществеността Дарио Амодей, главен изпълнителен директор на Anthropic, отправи остра критика към DeepSeek, процъфтяваща фирма за изкуствен интелект от Китай.Той изрази значителна загриженост по отношение на ефикасността на AI моделите на DeepSeek в контекста на тестовете за безопасност на биооръжията.В скорошно интервю Amodei разкри, че моделите на AI, произведени от DeepSeek, нямат предпазни мерки срещу генериране на чувствителна информация, свързана с биологични оръжия.

Процеси на оценка на рисковете за националната сигурност

Amodei разработи рутинните оценки на Anthropic на различни AI модели, за да идентифицира потенциални опасности за националната сигурност.Тези оценки са предназначени да определят дали моделите могат да генерират информация за биологични оръжия, която не е лесно достъпна чрез конвенционалните търсачки или академична литература.Този подход е от жизненоважно значение за разбирането как нововъзникващите AI технологии могат да бъдат злоупотребени.

„Моделът DeepSeek се справи най-лошо от всички модели, които някога сме тествали, тъй като нямаше абсолютно никакви блокове срещу генерирането на тази информация.“— Дарио Амодей, главен изпълнителен директор на Anthropic

Бъдещи последици от настоящите модели на ИИ

Въпреки че Amodei призна, че нито един настоящ модел на AI, включително този на DeepSeek, не представлява „буквална опасност“ чрез разпространение на рядка и потенциално вредна информация, той предупреди за последиците от бъдещи итерации на модела.Коментарите на главния изпълнителен директор са особено забележителни, тъй като DeepSeek наскоро придоби популярност за своя модел R1, който беше възприет от големи облачни доставчици като AWS и Microsoft.

Тревожни констатации в тестовете за безопасност

Тази критика съвпада с нарастващите опасения относно мерките за безопасност на DeepSeek.Доклад, издаден от изследователи по сигурността на Cisco, показва, че моделът DeepSeek R1 не е успял да блокира никакви вредни подсказки по време на техните оценки на безопасността, което отразява зашеметяващия 100% процент на успешен джейлбрейк.Забележително е, че други водещи AI модели, като Llama-3.1-405B на Meta и GPT-4o на OpenAI, показаха сходно високи нива на неуспех в тези оценки, което подчертава, че проблемът не е изолиран.

Законът за балансиране: иновации срещу сигурност

Тъй като глобалната конкуренция в AI се ускорява, прозренията, споделени от Amodei, подчертават спешната нужда от стабилни рамки за безопасност и регулаторни мерки при разработването на усъвършенствани системи за AI.Този сценарий рисува ярка картина на сложните предизвикателства, пред които е изправена индустрията на изкуствения интелект, докато се стреми да насърчава бързи иновации, докато се справя със свързаните рискове за сигурността.

За допълнително четене и изображения, свързани с тази критична дискусия, вижте източника

Често задавани въпроси

1.Какви конкретни проблеми повдигна Дарио Амодей относно моделите на AI на DeepSeek?

Amodei подчерта, че моделите на DeepSeek се представят зле при генерирането на чувствителна информация за биологичните оръжия, като им липсват необходимите предпазни мерки по време на тестовете за безопасност.Това породи сериозни опасения относно потенциалната злоупотреба с такава технология.

2.Срещат ли се други модели с AI подобни критики относно безопасността?

Да, водещи модели от други компании, като Llama-3.1-405B на Meta и GPT-4o на OpenAI, също показаха висок процент на неуспех в тестовете за безопасност, което показва, че предизвикателствата за осигуряване на безопасност в AI моделите са широко разпространени в индустрията.

3.Защо оценките на безопасността на AI моделите са от решаващо значение за националната сигурност?

Оценките на безопасността помагат да се определи дали AI моделите могат да генерират чувствителна или вредна информация, която може да бъде злонамерено използвана.С напредващата технология осигуряването на надеждни тестове за безопасност е жизненоважно за националната сигурност и обществената безопасност.

тук