Моделът вече може да води по-дълги разговори
Преди дни бе представена третата усъвършенствана версия на BgGPT, заради която потърсихме разработчиците с молба да ни разкажат повече за българския модел. Питаме какво е новото, колко по-дълги разговори можем да водим и какви изображения може да разчита. Интересуваме се и възможно ли е да превръща звукови файлове в текстови, както и дали да му вярваме безрезервно.
- Преди дни бе представена третата версия на BgGPT. Стана ли по-умен българският вариант на изкуствения интелект?
- В общи линии можем да кажем по-умен, но за да сме по-конкретни в това, което сме направили по-добре, ще кажа, че моделът вече разбира значително по-голямо количество текст, може да води по-дълги разговори, той е мултимодален, тъй като има и възможността да разпознава картинки. В чат приложението има възможност да разпознава и глас, т. е. вместо да пишем текст от клавиатурата, директно той да се транскрибира с нашия глас. Подобрили сме и функциите за търсене в интернет, създадена е и възможност за по-дълбоки разсъждения по сложни проблеми.
- Българският изкуствен интелект (ИИ) в първата си версия правеше и правописни грешки, направихте ли го и по-грамотен?
- Надяваме се с всичко да е по-добър. Първата версия беше и с много малък модел, сега има значително повече конкретност.
- Може ли да дадете пример как моделът ни помага по картинка - преди малко ни бе казано, че едно от цветята на ваш колега боледувало, показана била картинка на BgGPT и последвали съвети как да се съживи цветето.
- Подобни примери са възможни. Тук направих една интересна демонстрация когато представях модела. Снимах града и попитах кой е този град. Разпознава София по различни структури, по Витоша. Мисля, че едно от най-смислените неща за правене е ако имате документ на хартия, може да го снимате и да поискате директно текста от документа. Това се нарича оптично разпознаване на символи.
- Ако се загубим в чужбина, чрез модела ще успеем ли да се намерим?
- BgGPT няма локация, но ако сте толкова изгубени, че да трябва да направите снимка на околността и тогава да разберете къде сте, бих казал, че има и по-лесни начини за намиране.
- Можем ли да му се доверяваме безрезервно?
- По никакъв начин, както не можем безрезервно да се доверяваме на нищо - още повече пък на изкуствения интелект, който и да е той. Трябва да се проверяват източниците.
- С GPT Chat имаше проблем, даваше медицински съвети, наложи се ограничаването му от тази дейност. В българския вариант помислено ли е за това да не се позволява на изкуствения интелект да ни лекува?
- Поведението ще е подобно като на GPT Chat, не ограничаваме възможността да даде някаква полезна информация по здравословен проблем. Това, което целим е да каже „аз все пак не съм лекар, тук предоставям полезна информация, но по-добре отидете на лекар.“
- Разработили ли сте отделни модели за различни професии - оказа се, че за юристите, например е необходим строго специализиран ИИ, за да се избегнат грешки със сложната материя, от бизнеса също имат подобни претенции...
- Да, това е едно от приложенията, които работи доста добре. Представители на бизнеса, които искат да имат още по-висок суверенитет на изкуствен интелект могат да го адаптират за собствените си нужди както чрез приложения, надградени върху моделите, които ние сме оставили за свободно изтегляне и всеки с компютър може да го направи.
- Успяхте ли да избегнете слабостта на AI да се държи конформистки - да се съгласява с потребителя и оттам да произтичат грешки?
- Съгласен съм, че това е сериозен проблем, но той все още не е решен на глобално ниво. Доста интересно, тъй като може би това е една от основните функции на езиковите модели - хората си ги представят като събеседници и очакват да имат собствено мнение и да кажат, примерно: Не съм съгласен с това, което вие казвате. Но той няма контекста да го направи - той просто е един много умен папагал, който рецитира неща, които вече е виждал.
- Заговори се и за опасност от пристрастяване и дори влюбване в изкуствения интелект. Има ли подобни рискове, свързани с българския модел?
- Като личност не сме обърнали внимание как ще се държи модела в подобни ситуации. Мисля, че си спомням случая, за който говорите. Струва ми се, че всеки който иска по този начин да комуникира с моделите, някои от по-големите ще се справят по-добре да убедят, че са истински и едва ли не има някаква личност зад тях. При BgGPT говорим за нещо което е полезно в ежедневни задачи, в работата.
- Много хора, които са самотни, вместо да търсят човешко общуване, си говорят с ИИ. Може ли това да се превърне в сериозен проблем?
- Не съм психолог и нямам експертиза по темата. Не си представям, че е голям проблем и че е широко разпространен.
- С какъв тип информация е трениран българският изкуствен интелект?
- Ако трябва да обобщя - с всякаква. В крайна сметка текстът се извлича от интернет от сайтове, от wikipedia и подобни източници на качествен текст.
- Нали знаете, че wikipedia не е пример за качествена информация?
- Тук не става въпрос за информация. Когато обучаваме един езиков модел, във фазата му на претрениране, това което искаме да постигнем, са лингвистичните способности. Затова има функции, като търсене в интернет, за да може да изважда актуалната информация, а не да рецитира по памет. Все пак wikipedia дори и да не е надежден източник на 99% е един от по-добрите източници на информация, които можем да намерим в интернет извън сериозни научни публикации и статии.
- Какви изображения и документи могат да се анализират с BgGPT?
- Изображения всякакви, а откъм документи предстои да разширяваме гамата - засега може да обработва документи в word, pdf и др.
- Има ли опция за превръщане на звуковия файл в текстови?
- Все още нямаме качване на звукови файлове, но смятаме да го добавим. Ако с глас зададем това, което искаме то се превръща в текст чрез функция от приложението.
- При представянето бе посочено, че може да води 20 пъти по-дълги разговори - какво е изражението в минути или текстови обем?
- Текстовият обем сега е над 50 000 думи, може би малко повече откъм контекст. В крайна сметка средното е по 500-600-1000 на разговор. Но вече имаме и потребители, които са надминали над 150 хода с модела и са задали над 80 въпроса в един разговор.
- Това за колко време се случва?
- Ако имате предвид за колко време моделът отговаря - между 1 секунда и 2 минути, ако има нужда да помисли, да потърси повече за всеки от ходовете.
- А колко време можем да му задаваме въпроси?
- Няма ограничения в количеството въпроси и времето на ползване.
- Т. е. той не се уморява?
- Не се уморява и можем да го питаме колкото искаме. Абсолютно.
- Имате ли информация каква част от българите ползват ИИ и в кои сфери е най-честото му приложение?
- Имаме информация за BgGPT, няколко стотин хиляди потребителя и всеки ден се увеличават. Досега нямаше мобилни приложения и сега това допълнително увеличава потребителите. Още преди време бяхме анализирали по-подробно някои от въпросите и се оказа, че около 25 на сто от тях са свързани с някакъв вид образование - въпросите, които се задават са или научно-популярни, или тестови. Нещо, което можем да срещнем или в учебна тетрадка, или по учебен предмет.
- Може ли да се учи език с ИИ?
- Бих казал, че това е един от по-интересните и по-полезни начини за използване на ИИ. Учителят по който и да е език не би могъл да се замени от изкуствения интелект, но като учебно помагало той е много полезен. Бихме могли да го питаме тази дума възможно ли е да я сменя с еди коя си, или как бих могъл по-добре да каже следната фраза и т. н. Имаме един добър и постоянен асистент, който може да ни помага не само в областта на езиците, но и във всякакви други области.
- Това безплатно ли е?
- Всичко това е безплатно с BgGPT.
- Ще направи ли определени професии излишни и кои са те?
- Мисля, че това е един от най-често задаваните ми въпроси. Тезата ми е, че изкуственият интелект няма да замени хората, но подобно на това как бормашината улеснява начина, по който пробиваме дупки и ИИ ще улесни и увеличи производителността на всеки от нас, който работи за да превърне една информация в друга. Особено, ако работи дигитално. Това са професии, в които ползването на изкуствени интелект от всякакъв тип прави служителя по-конкурентен на пазара на труда.
- А изкушени ли сте да разработите и робот с ИИ?
- Аз не се занимавам с това, но в INSAIT има екип, който работи над ИИ за роботи, такъв който можем да го поставим в роботи и той да разбира света. Примерно в една ръка, която да се постави във фабрика и тя да манифактура различни предмети.
- В Китай и други азиатски страни много от хотелите се обслужват от роботи. Ще се случи ли това и у нас?
- От нашата перспектива това е доста елементарно, макар че роботите са доста сложни от гледна точка навигиране на една постоянно изменяща се среда, за да може роботът да „осъзнава“ отворена ли е вратата, нагънат ли е килима, има ли опасност да се спъне и т. н. Като хора знаем как изглеждат тези неща, но не си даваме сметка за комплексността на света.
- Ще се стигне ли до създаване на робот, който има чувства?
- С чувства? Ако знаех какво са чувства и емоции по този начин, може би щеше да е възможно да ги сложа в един робот. Трудно е да предположим и за хората как постигаме всичко. Доста научнофантастично звучи, но може би няма да разберем кога се е случило това, защото сами не можем да дефинираме елемента на чувства и емоции. Какво за нас хората са чувства, каква част от нас, какво парче от човечеството са чувствата.
- Има ли опасност ИИ в някакъв момент да започне да действа независимо от човека и да се превърне в разрушител?
И в момента се получават халюцинации, така наричаме всичко, което моделът произведе и ние не сме доволни. Но за по-страшния сценарий, който интригува повече хората, ще припомня, че всички компютри имат копчета за изключване. Освен това те нямат достъп до толкова критични среди, освен ако не ги внедрим по този начин. Естествено, ако имаме някаква критична база данни и дадем на някакъв агент с езиков модел зад него да управлява тази база данни. И ако сме му дали контрол да изтрива част от базата данни, в един момент може нещо да се обърка и той да изтрие всичко. Такива сценарии вече са се разигравали, естествено трябва да сме по-внимателни.
Нашият гост
Антон Александров е докторант в Института за компютърни науки, изкуствен интелект и технологии към Софийски университет от октомври 2023 г. Той е един от главните разработчици на BgGPT. Завършил е магистратура по Компютърни науки, специалност Машинно обучение, във водещия технологичен институт в Европа ETH Цюрих. Преди това завършва с отличие бакалавърска степен по Компютърни науки в Университета в Уоруик, Великобритания и Софийската математическа гимназия (СМГ).