Сервисы искусственного интеллекта представляют собой платформы, использующие нейросети для обработки данных, генерации текстов, изображений, видео и звуков. Они позволяют автоматизировать задачи, создавать контент, улучшать качество переводов, помогать осваивать новые знания.
- Цифровизация интегрируется во многие сферы жизни. Она важна для развития общества. Место для обычного человека останется, но знания цифровых инструментов становятся обязательными. Описать конкретно, какое будущее нас ждет, пока трудно, так как технологии очень быстро развиваются, - говорит председатель Всемирного форума татарской молодежи (ВФТМ) Райнур Хасанов.
Именно под эгидой ВФТМ работают активисты и волонтеры «Нейротатарлар». Они на общественных началах создают нейросеть, которая станет учить людей татарскому языку, а также будет включать в себя и сервис по автоматическому исправлению ошибок в тексте. Но сначала разработчикам нужно собрать тексты на 700 миллионов слов, чтобы получить на выходе большой монокорпус татарского языка. На данный момент преодолена планка в 300 миллионов слов.
- В идеале, если собрать монокорпус, создать модели и на их основе разработать текстовый языковой помощник для изучения татарского языка, то он сможет выполнять роль учителя, которому можно задавать любые вопросы. Уже сейчас в ChatGPT-4 можно переписываться на татарском. Однако ответы не всегда идеальны, - пояснил Хасанов.
Казанскую нейросеть будут обучать различные открытые языковые модели, что позволит создавать и другие полезные продукты.
- Это языковые модели искусственного интеллекта для обработки татарского, которые помогут разработать продукты - например, языкового помощника или сервис для автоматического исправления ошибок, - рассказал спикер.
Разработку «Нейротатарлар» собираются сделать доступной для самой широкой аудитории. Речь в том числе идет и об огромных компаниях, которые желают интегрировать татарский язык в свой рабочий процесс. Возможно, уже к концу 2024 года, когда в свет выйдет демоверсия продукта, им будет что предложить. Но впереди еще кропотливая работа по сбору языкового материала и тестирование.