В Казахстане разработана большая языковая модель KazLLM — развитие ИИ на казахском языке

В рамках поручения Главы государства разработана Большая языковая модель KazLLM, направленная на развитие искусственного интеллекта на казахском языке.

В рамках реализации данного поручения Министерством науки и высшего образования Республики Казахстан с привлечением Институт умных систем и искусственного интеллекта при Nazarbayev University (ISSAI NU), научных институтов и высших учебных заведений проведена работа по обеспечению корпуса казахского языка для национальной языковой модели KazLLM.

Следует отметить, что данная мера будет способствовать созданию эффективных решений для обработки, перевода и анализа текстовой информации на казахском языке, а также на интеграцию казахского языка в современные технологии. В условиях глобализации и стремления к сохранению культурной самобытности страны значимость проекта становится особенно актуальной.

Cвыше 140 ученых и сотрудников 26 ведущих научных институтов и вузов страны, принимавших участие в разработке корпусе казахского языка для KazLLM, занимались подготовкой больших объемов данных по экономике, финансам, математике, истории, биологии, химии, медицине, технологиям и другим 115 областям науки на казахском языке. Например, Казахский национальный университет им. аль-Фараби осуществил подготовку данных по философии, этике, PR, астрономии, астрофизике и информационным технологиям, Институт математики и математического моделирования – составлением данных по направлениям математики, Институт истории и этнологии имени Ш.Уалиханова – контентом по истории, а медицинские университеты – данных в области медицины. Это сотрудничество с учреждениями науки и высшего образования способствовало созданию уникального контента на казахском языке, что обеспечит качественную и эффективную разработку модели.

На сегодняшний день доступна версия KazLLM с открытым исходным кодом на платформе https://huggingface.co/issai.

Данную модель, которая является важной частью цифровой инфраструктуры, можно использовать в некоммерческих научных и академических целях, а также в создании чат-ботов, виртуальных помощников, автоматических переводчиков, по аналогии с Google Translate.

Новые статьи

В Казахстане из-за развития ИИ могут сократить сотни тысяч рабочих мест

В ближайшие 10 лет влияние искусственного интеллекта может серьезно изменить рынок труда Казахстана. По прогнозам Центра развития трудовых ресурсов, до 400 тысяч человек могут...

Касым-Жомарт Токаев встретил Реджепа Тайипа Эрдогана в Астане

Во Дворце Независимости в Астане состоялась торжественная церемония встречи Президента Турецкой Республики Реджеп Тайипа Эрдогана, прибывшего с государственным визитом в Казахстан. Президента Турции лично встретил...

Риддер остается одной из главных летних баз подготовки лыжников Казахстана

В Риддере продолжается активная подготовка спортсменов зимних видов спорта к новому соревновательному сезону. Благодаря природным условиям и развитой спортивной инфраструктуре город остается одной из...

На трассах Восточно-Казахстанской области обновляют дорожную разметку и знаки

В Восточно-Казахстанской области продолжаются работы по содержанию автомобильных дорог республиканского значения. Мероприятия проводятся в рамках комплексной целевой программы по обеспечению безопасности и улучшению качества...