Д-р Слав Петров, Google: Не мисли само за малки проблеми, а искай да промениш света
Д-р Слав Петров е тазгодишният носител на наградата "Джон Атанасов", на която патрон е президентът Росен Плевнелиев. д-р. Петров работи в Google и по-точно в научното звено за разработки в Ню Йорк. Неговите разработки се използват от онлайн преводача Google Translate. Роден е в София, като през 1991 г. се мести с родителите си в Берлин. Там завършва магистратура и се премества в университета в Бъркли, Калифорния за докторантурата си. От 2009 г. е в Google.
Каква е основната ви дейност в Google?
- Ръководя екип за компютърна лингвистика. Занимаваме се с граматичен анализ и как той да се приложи за машинен превод в Google Translate и в гласовия асистент.
Какви са основните трудности да научиш компютър на човешки език?
- Проблемът е, че за нас, хората, всяко изречение има смисъл. За компютъра обаче може да има хиляди различни значения. Понякога хората нарочно правят шеги в изреченията и думите. За компютъра това е проблем. Например: "Аз ям спагети с доматен сос" или "Аз ям спагети с вилица". Макар изреченията да са сходни, човек ще разбере смисъла им. Но реално в единия пример казваш с какво още ядеш спагетите, а в другия - по какъв начин се ядат. Тези нюанси са предизвикателство за компютрите.
Основно тези разработки се използват за Google Translate. Сега започваме да ги използваме и за отговаряне на въпроси. Например можеш да попиташ гласовия асистент на Google на български "Кой е президентът на България?" и ще получиш отговор, като работим и по увеличаването на възможностите за комуникация.
Например, ако попиташ на английски "Кой е президентът на САЩ?", ще получиш отговор и след това ще можеш да зададеш втори въпрос "Къде е роден той?". Софтуерът сам ще разбере, че "той" е президентът на САЩ. След това, ако попиташ "Женен ли е?" ще получиш отговор. Идеята е софтуерът да може да следва не само въпросите, но и контекста на разговора. Искаме да развием тази функция за повече езици, тъй като това е бъдещето. Хората не искат да пишат, а искат да говорят с устройствата си.
Занимавате ли се с други проекти извън компютърната лингвистика?
- В последно време се занимавам само с нея. Преди се занимавах и с роботика, анализ на снимки и видео. Но сега не ми остава време за друго.
Какво ви мотивира да се кандидатирате за наградата "Джон Атанасов"?
- Това е престижна награда. Познавам и предишни нейни носители, които ме подкрепиха и ми казаха, че имам добър шанс.
Често ли идвате в България?
- Всяка година поне по един път. Повечето ми роднини са си тук. Имам и приятели тук, особено в БАН.
На награждаването споменахте, че се надявате на увеличено сътрудничество с БАН. В какво се изразява то?
- Малко по-късно ще разговаряме, за да видим дали може да направим нещо. Не мога да обещая, че Google ще направи нещо голямо тук. Но мога да кажа, че в моя екип вече има един българин, скоро и друг носител на наградата "Джон Атанасов" - Кузман Ганчев, ще се присъедини.
Преди години искахме да работим със специалисти от БАН и да съберем данни, които да използваме за трениране на системата с български език. За жалост логистиката беше много трудна и Google намери друг начин, който доведе до възможността да можеш да говориш на български с Android и той да те разпознава.
Имате ли впечатления за нивото на науката у нас?
- Честно казано, не познавам много хора тук. Познавам българи, които са в чужбина, и пропорционално в компютърната лингвистика има много българи. Повече са, отколкото някой би очаквал за такава малка държава, и хората остават изненадани.
Често ме питат на какво се дължи това. Не знам какъв е точно отговорът, но смятам, че от БАН и от специалността по компютърна лингвистика в Софийския университет излизат добри хора.
Вероятно сте чували и за зараждащата се стартъп култура у нас. Като човек с поглед над технологиите извън нашето ежедневие в региона, какво бихте посъветвали тези компании?
- Да, знам за стартъп обществото тук. Наскоро в Берлин, който също е своеобразна столица на стартъпи, гледах репортаж за българи, които са учили там и сега си идват в България, за да развиват бизнесите си тук. Това, което научих в Америка, е да не мислиш само за малки проблеми. Трябва да имаш големи амбиции и да пробваш да промениш света.
Не трябва да се страхуваш, че започваш сам. Всичко може да се случи. Технологиите не изискват огромни фирми. Може и някоя малка фирма с няколко души персонал да направи нещо много голямо и интересно.
Паралелно с работата си в Ню Йорк организирате и курсове, където преподавате на студенти. Кое се оказва по-лесно: да създаваш и разработваш нови технологии или да ги преподаваш?
- И двете са ми много интересни. Определено не бих искал да правя само едното или само другото. Работата ми позволява да виждам кои неща се използват в реалността. Това позволява да дадеш по-интересна перспектива. Google е на доста високо ниво и когато студентите чуят, че дадено нещо наистина се използва, а не е само теория, това привлича много голям интерес.
Хубавото на преподаването е, че те кара да седнеш и да погледнеш нещата отстрани. Можеш да видиш дали това, което правиш, е основа за нещо по-голямо и как да организираш всички различни системи. Докато пишеш лекцията се замисляш по-дълбоко за някои неща и си организираш твоето мислене, което помага за изследователската работа.
Самите студенти вероятно също често дават интересни идеи или гледни точки.
- Да, това е много важно. Не обичам да говоря само аз и да ме слушат. Предпочитам да е по-интерактивно. Лекциите, които преподавам, първоначално бяха за 15 души. Миналата година ги увеличихме на 30, но не искам да са повече, тъй като става трудно да има диалог. Когато са по-малко, хората питат въпроси, получава се дискусия и това дава идеи за много неща.
В тази връзка, как трябва да протича едно обучение? У нас много се говори за необходимостта от образователна реформа, но реалните действия са много малко.
- Специално за информатиката - тя е приложна наука и е важна практиката. Трябва да се програмира, но не общи примери, а практически неща, които след това студентите могат да използват за нещо. Например в моя курс по компютърна лингвистика студентите правиха проекти за граматичен анализ.
Последната година пък направих друга система. След като студентите програмират проекта си, трябваше да го качат в една страница и там той автоматично се тестваше на изцяло нови данни. След това излизаше конкретен резултат на точност на анализа. Имаше и класация за най-добрите.
Тъй като всеки искаше да е първи, всички студенти положиха много повече усилия в домашните и постигнаха по-интересни резултати, измислиха нови техники. Затова е важно обучението да е практическо, да не е само математика и теория.
Невинаги е възможно, но често е възможно.
И накрая, един класически стандартен въпрос: Какво предстои за вас в бъдеще?
- Повече от същото. Не очаквам да се промени нещо. В Google подготвяме доста
интересни неща, които следващата година ще покажем и продължаваме напред. В компютърната
лингвистика също има доста ползотворни неща и голям напредък. Но е ясно, че в
следващите 3 до 5 години няма да имаме компютри, които да разбират езика напълно,
така че ще си имам работа (смее се).
Източник: Дневник