В Казахстане разработана большая языковая модель KazLLM — развитие ИИ на казахском языке

В рамках поручения Главы государства разработана Большая языковая модель KazLLM, направленная на развитие искусственного интеллекта на казахском языке.

В рамках реализации данного поручения Министерством науки и высшего образования Республики Казахстан с привлечением Институт умных систем и искусственного интеллекта при Nazarbayev University (ISSAI NU), научных институтов и высших учебных заведений проведена работа по обеспечению корпуса казахского языка для национальной языковой модели KazLLM.

Следует отметить, что данная мера будет способствовать созданию эффективных решений для обработки, перевода и анализа текстовой информации на казахском языке, а также на интеграцию казахского языка в современные технологии. В условиях глобализации и стремления к сохранению культурной самобытности страны значимость проекта становится особенно актуальной.

Cвыше 140 ученых и сотрудников 26 ведущих научных институтов и вузов страны, принимавших участие в разработке корпусе казахского языка для KazLLM, занимались подготовкой больших объемов данных по экономике, финансам, математике, истории, биологии, химии, медицине, технологиям и другим 115 областям науки на казахском языке. Например, Казахский национальный университет им. аль-Фараби осуществил подготовку данных по философии, этике, PR, астрономии, астрофизике и информационным технологиям, Институт математики и математического моделирования – составлением данных по направлениям математики, Институт истории и этнологии имени Ш.Уалиханова – контентом по истории, а медицинские университеты – данных в области медицины. Это сотрудничество с учреждениями науки и высшего образования способствовало созданию уникального контента на казахском языке, что обеспечит качественную и эффективную разработку модели.

На сегодняшний день доступна версия KazLLM с открытым исходным кодом на платформе https://huggingface.co/issai.

Данную модель, которая является важной частью цифровой инфраструктуры, можно использовать в некоммерческих научных и академических целях, а также в создании чат-ботов, виртуальных помощников, автоматических переводчиков, по аналогии с Google Translate.

Новые статьи

Абай облысындағы көп жылға созылған жер дауына сот нүкте қойды

Іс облыстық мамандандырылған ауданаралық әкімшілік сотында қаралды. Оқиға 2008 жылы басталған. Сол кезде шаруа қожалығының басшысы Ақсуат ауданындағы жалпы аумағы 420 гектар болатын үш жер...

В Казахстане из-за развития ИИ могут сократить сотни тысяч рабочих мест

В ближайшие 10 лет влияние искусственного интеллекта может серьезно изменить рынок труда Казахстана. По прогнозам Центра развития трудовых ресурсов, до 400 тысяч человек могут...

Касым-Жомарт Токаев встретил Реджепа Тайипа Эрдогана в Астане

Во Дворце Независимости в Астане состоялась торжественная церемония встречи Президента Турецкой Республики Реджеп Тайипа Эрдогана, прибывшего с государственным визитом в Казахстан. Президента Турции лично встретил...

Риддер остается одной из главных летних баз подготовки лыжников Казахстана

В Риддере продолжается активная подготовка спортсменов зимних видов спорта к новому соревновательному сезону. Благодаря природным условиям и развитой спортивной инфраструктуре город остается одной из...