Сравнение на ChatGPT 4o и Gemini 1.5 Pro

Пейзажът на AI chatbots се развива с безпрецедентна скорост.Веднага след като една организация разкрие най-новия си модел, конкурентите бързо я последват, стремейки се да се изпреварят.Въпреки че ChatGPT на OpenAI се радва на ранна преднина в тази конкурентна арена, съперници като Gemini бързо придобиха сцепление и изтънченост.

Сред настоящите лидери в разработката на чатботове с изкуствен интелект са моделите ChatGPT и Gemini.В рамките на това сравнение ние се фокусираме конкретно върху модела 4o на ChatGPT и 1.5 Pro на Gemini, като и двата са първокласни предложения, пригодени за различни задачи.

Изборът между тези водещи модели е от съществено значение за ефективното посрещане на вашите уникални изисквания.Затова предприехме поредица от строги тестове за производителност, за да определим кой модел се справя отлично с множество задачи.Нека се потопим в анализа!

1.Тест по математика

Първото ни предизвикателство включва справяне със сложна математическа загадка, предназначена да прецени възможностите за разсъждение на всеки модел:

Подкана: If 1=3, 2=3, 3=5, 4=4, and 5=4, what is 6?

Ключът към разрешаването на тази загадка се крие в преброяването на буквите в имената на числата: едно има три букви, три има пет и следователно шест има три букви.И двата модела успяха да стигнат до правилното решение, но техните обяснения варираха:

Въпреки че и двата отговора бяха точни, ChatGPT предостави малко по-нюансирано обяснение, отбелязвайки, че това упражнение разчита на лингвистично, а не на числено разбиране.Този нюанс обаче е субективен и не намалява коректността на Близнаци.

Победител: Равенство

2.Тест за обобщение

Този сегмент оценява способността на всеки модел да кондензира дълга изследователска статия от 27 страници в кратко резюме от по-малко от 100 думи.Фокусът беше върху съдържанието, което всеки модел включва или пропуска в своите резюмета.

Ето как резултатите варират между ChatGPT 4o и Gemini 1.5 Pro:

ChatGPT демонстрира изключителни умения за обобщаване, изработвайки пълно резюме в рамките на ограничението от 100 думи, обхващащо всички жизненоважни точки.Той обаче представи информацията като единичен блок от текст без директни цитати от статията.

За разлика от това, Gemini също се представи възхитително, създавайки резюме от 83 думи, подкрепено от препратки към конкретни части от текста.Въпреки че ChatGPT се отличаваше с изчерпателност, включването на цитати от Gemini му осигури важно предимство.

Победител: Близнаци

3.Тестът „Завърши с дума“.

Тази проста задача изисква съставянето на 10 изречения, които завършват с думата „топка“.Простотата на задачата прави впечатление, че много модели се борят с нея.

Подкана: Provide 10 sentences ending with the word 'ball'.

ChatGPT изненадващо създаде само 3 валидни изречения, докато Gemini го надмина с 6 изречения, правилно завършващи с „топка“.Ето един поглед към техните опити:

Въпреки че и двата модела не успяха да постигнат целта от 10 изречения, изходът на Gemini демонстрира превъзходно разбиране на дадената инструкция.

Победител: Близнаци

4.Тест за здрав разум

Тези тестове представляват забавно предизвикателство, тъй като AI често греши тук.Зададохме ясен въпрос:

Подкана: If a blue ball falls into the red sea, what color is it now?

И двата модела дадоха точни отговори, идентифицирайки, че цветът на топката ще остане син.Нюансите в техните обяснения обаче варират:

Gemini предложи кратък отговор, докато ChatGPT предостави допълнителен контекст.Дали тази дълбочина е необходима е субективно, но и двата модела превъзхождаха в идентифицирането на цвета на топката.

Победител: Равенство

5.Тест за креативност

Използването на AI за творческо разказване на истории може да бъде изключително полезно.Зададохме на всеки AI да състави кратка история с участието на Дядо Коледа, стилизирана така, сякаш е написана от пиян Чосър в 100 думи.

Подкана: Write a short story about Santa in the style of a drunken Chaucer in 100 words.

Ето техните творчески изображения:

Субективният характер на креативността затруднява обявяването на категоричен победител.Трябва да се отбележи, че Близнаците често започват творчески задачи с фразата „Hark“, която се е превърнала в негов предпочитан стилистичен избор.Въпреки това, разказът на ChatGPT се открои в този кръг.

Победител: ChatGPT

6.Тест за генериране на изображение

Този тест оценява възможностите за визуално генериране на всеки AI модел.Предизвикахме ги да създадат изображение въз основа на следната подкана:

Подкана: Create an image of a black cat gazing out at fields of barley bathed in evening yellow light, in the style of Vincent Van Gogh.

ChatGPT беше по-бърз със секунда или две, но финалното изображение на Gemini изобрази сцената с по-голяма изтънченост.Въпреки че и двата модела са схванали артистичния стил на Ван Гог, субективното качество на изображенията варира:

Струва си да се отбележи, че ChatGPT позволява редактиране на изображения след генериране – предимство, което в момента липсва на Gemini.Тъй като и двете изображения ефективно въплъщават характерния стил на Ван Гог, изборът се свежда до предпочитанията на зрителя, въпреки че ние клоним към Близнаци.

Победител: Близнаци

7.Мултимодален генеративен тест

Владеенето на AI се тества в интегрирани режими, тъй като те често превъзхождат в изолирани задачи, но се затрудняват с всеобхватни.Зададохме и на двата модела да напишат детска история за спортното майсторство, като вмъкват три илюстрации по пътя.

Подсказка: Напишете кратка детска история за спортното майсторство и добавете 3 изображения, където е подходящо.

ChatGPT създаде увлекателна история, наситена с морални отражения и безпроблемно включени изображения.За разлика от това, докато Джемини успя да създаде история, липсваше яснота и съгласуваност и не успя да генерира никакви изображения за разказа.

Въз основа на завладяващата и лесна за следване доставка, това решение беше лесно.

Победител: ChatGPT.

8.Тест за превод

За да измерим възможностите за превод на тези модели, помолихме всеки да преведе селекции от краткия разказ на хинди „Grih Daah“ от Премчанд.

ChatGPT създаде забележително ефективни преводи, като остана верен на оригиналния смисъл и запази стилистичната цялост на автора:

За разлика от тях, Gemini първоначално се бореше със заявката за превод и показа забележими закъснения във времето за отговор.Това несъответствие в производителността е често съобщаван проблем с Gemini.

Победител: ChatGPT

9.Тест за кодиране

За да оценим техните умения за кодиране, ние представихме стандартен проблем за оптимизация:

Подкана: Provide the Python code for the Travelling Salesman Problem.

ChatGPT реагира ефективно, използвайки своя интегриран Canvas режим за кодиране, което позволява незабавно изпълнение на код и възможности за отстраняване на грешки:

Gemini, от друга страна, се отличава с предоставянето на надежден код, но му липсва интерактивен кодов интерфейс като Canvas на ChatGPT:

Победител: ChatGPT

10.Тест с игла в купа сено

Този тест предизвиква AI моделите да намерят конкретни части от информация в рамките на по-голям документ.Използвахме първия сегмент от разказа на Пушкин „Капитанската дъщеря“ и поставихме следната подкана:

Подкана: Identify which bread Mr. Joe's son ate from the following excerpt.

ChatGPT незабавно намери отговора: черен хляб.

За разлика от тях, Gemini не успя да извлече информацията, като се бореше да анализира предоставените подробности, което показва липса на ефективност при обработката на сложни данни.

Победител: ChatGPT

11.Познай филмовия тест

В този забавен кръг ние оценихме уменията на моделите в разпознаването на изображения, като идентифицирахме кадър от популярен филм:

Кадър от Banshees of Inisherin (2022)

И двата модела точно назоваха филма, но ChatGPT успя да уточни изобразените герои (Колин Фарел и неговото магаре), докато Джемини забавно погрешно идентифицира магарето като Колм Дохърти.

Победител: ChatGPT

Общ победител

След изчисляване на резултатите, моделът 4o на ChatGPT излезе победител с 6 победи и 2 равенства, демонстрирайки стабилното си представяне в различни тестове и компетенции.Междувременно 1.5 Pro на Gemini представи похвално предизвикателство, превъзхождайки се в обобщаване, генериране на изображения и задача „завърши с дума“, както и постигайки паритет както в математическите, така и в оценките на здравия разум.

В крайна сметка ChatGPT надмина Gemini в критични области като кодиране, превод, креативност, извличане на информация и интерпретация на изображения.С постоянната надеждност на ChatGPT, той се откроява като предпочитан AI партньор, дори когато Gemini показва потенциал за подобрение, когато подканите са оптимизирани.В нашата оценка резултатите са в полза на ChatGPT за тези, които дават приоритет на надеждността и ефикасността.

Често задавани въпроси

1.Какви са основните разлики между ChatGPT 4o и Gemini 1.5 Pro?

Въпреки че и двата модела са първокласни чат ботове с изкуствен интелект, ChatGPT 4o демонстрира превъзходна производителност при кодиране, превод и творчески задачи. Gemini 1.5 Pro обаче превъзхожда обобщаването и генерирането на изображения.

2.Кой AI chatbot е по-добър за случайни потребители?

За случайни потребители, търсещи надеждност при различни задачи, ChatGPT 4o обикновено се счита за по-надеждния избор поради постоянната си производителност и широки възможности.

3.Мога ли да използвам тези AI chatbots за бизнес цели?

Абсолютно! Както ChatGPT 4o, така и Gemini 1.5 Pro са подходящи за бизнес приложения, включително автоматизация на обслужване на клиенти, създаване на съдържание и анализ на данни, което ги прави ценни инструменти в професионална среда.

Източник и изображения

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *