Модель тибетского языка получила высокую оценку на Пекинской научно-технической ярмарке

На 28-й Китайской международной выставке науки, технологий и промышленности в Пекине значительное внимание привлекла крупная языковая модель, способная «понимать» тибетский язык и генерировать контент с использованием тибетского стиля мышления. Разработанная исследовательской группой из Тибетского университета, эта модель под названием «DeepZang» демонстрирует прорывы в области искусственного интеллекта в сфере многоязыковой обработки и подчеркивает, как языки национальных меньшинств быстро интегрируются в глобальный цифровой ландшафт.
На протяжении многих лет основные крупные языковые модели обучались преимущественно на китайском и английском языках, что приводило к появлению перегруженных переводами и неуклюжих результатов при применении к языкам меньшинств, таким как тибетский. Чтобы преодолеть эту проблему, команда разработчиков собрала почти 70 миллионов параллельных предложений на тибетском и китайском языках и более 30 500 часов голосовых данных, охватывающих три основных региона тибетских диалектов: У-Цанг, Кхам и Амдо.
Отличительной чертой этой большой модели является ее способность «мыслить на родном языке». На выставке она продемонстрировала высокую практическую ценность: при составлении проекта контракта на торговлю яками, написании стихотворения в честь родителей или предоставлении профессиональных рекомендаций по питанию — ее ответы были точными и проникнутыми характерными культурными особенностями Тибета. Благодаря интеграции распознавания голосовых отпечатков с классификацией диалектов, модель эффективно решает проблемы коммуникации, возникающие из-за значительных различий в разговорных тибетских диалектах. Даже пользователи с ограниченной грамотностью могут легко взаимодействовать с помощью голоса.
Технологический прогресс напрямую повышает производительность. Лобсанг Дуню, переводчик из Шаннана, Тибет, отметил, что благодаря переводу с помощью ИИ документ, на который раньше уходило 40 минут у трех человек, теперь может быть переведен одним человеком чуть более чем за 20 минут. Сегодня у «DeepZang» более 300 000 пользователей, более 70% которых находятся в возрасте от 18 до 40 лет и проживают в отдаленных регионах Тибета, Цинхая, Сычуани и Ганьсу.
Несмотря на впечатляющие возможности, коммерциализация тибетского ИИ по-прежнему сталкивается с препятствиями, такими как высокие затраты на вычислительные мощности и финансовое давление. В ответ на это официальные лица заявили, что их первое участие в выставке было направлено на поиск единомышленников для совместного решения проблем, связанных с вычислительными мощностями и бизнес-циклами. По мере совершенствования сетей 5G и энергетической инфраструктуры по всему Тибету тибетский ИИ готов стать прочным мостом, соединяющим носителей тибетского языка с современным цифровым миром.
Связанная статья
В городе Цзибо открылась первая в провинции Шаньдун база по созданию комиксов с использованием искусственного интеллекта от Baidu
27 апреля провинция Шаньдун достигла важной вехи в сфере цифрового культурного творчества, официально открыв в Педагогическом колледже Цзыбо свою первую базу по созданию комиксов с использованием иску
Сандберг и Клегг вошли в совет директоров Nscale, а стартап «Stargate Norway» достиг оценки в 14,6 млрд долларов
На фоне резкого роста спроса на центры обработки данных, способные обеспечивать вычисления для ИИ в больших масштабах, британская компания Nscale, занимающаяся инфраструктурой для ИИ и поддерживаемая
Оценка Runway в 5,3 млрд долларов бросает вызов Google, поскольку ИИ в области видео превосходит ИИ в области языка
В то время как большинство гигантов в сфере ИИ вкладывают миллиарды в языковые модели, стартап Runway, занимающийся генеративным видео на базе ИИ, стремительно развивается по совершенно иному пути. По
Рекомендации по связанным специальным темам
Комментарии (0)

На 28-й Китайской международной выставке науки, технологий и промышленности в Пекине значительное внимание привлекла крупная языковая модель, способная «понимать» тибетский язык и генерировать контент с использованием тибетского стиля мышления. Разработанная исследовательской группой из Тибетского университета, эта модель под названием «DeepZang» демонстрирует прорывы в области искусственного интеллекта в сфере многоязыковой обработки и подчеркивает, как языки национальных меньшинств быстро интегрируются в глобальный цифровой ландшафт.
На протяжении многих лет основные крупные языковые модели обучались преимущественно на китайском и английском языках, что приводило к появлению перегруженных переводами и неуклюжих результатов при применении к языкам меньшинств, таким как тибетский. Чтобы преодолеть эту проблему, команда разработчиков собрала почти 70 миллионов параллельных предложений на тибетском и китайском языках и более 30 500 часов голосовых данных, охватывающих три основных региона тибетских диалектов: У-Цанг, Кхам и Амдо.
Отличительной чертой этой большой модели является ее способность «мыслить на родном языке». На выставке она продемонстрировала высокую практическую ценность: при составлении проекта контракта на торговлю яками, написании стихотворения в честь родителей или предоставлении профессиональных рекомендаций по питанию — ее ответы были точными и проникнутыми характерными культурными особенностями Тибета. Благодаря интеграции распознавания голосовых отпечатков с классификацией диалектов, модель эффективно решает проблемы коммуникации, возникающие из-за значительных различий в разговорных тибетских диалектах. Даже пользователи с ограниченной грамотностью могут легко взаимодействовать с помощью голоса.
Технологический прогресс напрямую повышает производительность. Лобсанг Дуню, переводчик из Шаннана, Тибет, отметил, что благодаря переводу с помощью ИИ документ, на который раньше уходило 40 минут у трех человек, теперь может быть переведен одним человеком чуть более чем за 20 минут. Сегодня у «DeepZang» более 300 000 пользователей, более 70% которых находятся в возрасте от 18 до 40 лет и проживают в отдаленных регионах Тибета, Цинхая, Сычуани и Ганьсу.
Несмотря на впечатляющие возможности, коммерциализация тибетского ИИ по-прежнему сталкивается с препятствиями, такими как высокие затраты на вычислительные мощности и финансовое давление. В ответ на это официальные лица заявили, что их первое участие в выставке было направлено на поиск единомышленников для совместного решения проблем, связанных с вычислительными мощностями и бизнес-циклами. По мере совершенствования сетей 5G и энергетической инфраструктуры по всему Тибету тибетский ИИ готов стать прочным мостом, соединяющим носителей тибетского языка с современным цифровым миром.
В городе Цзибо открылась первая в провинции Шаньдун база по созданию комиксов с использованием искусственного интеллекта от Baidu
27 апреля провинция Шаньдун достигла важной вехи в сфере цифрового культурного творчества, официально открыв в Педагогическом колледже Цзыбо свою первую базу по созданию комиксов с использованием иску
Сандберг и Клегг вошли в совет директоров Nscale, а стартап «Stargate Norway» достиг оценки в 14,6 млрд долларов
На фоне резкого роста спроса на центры обработки данных, способные обеспечивать вычисления для ИИ в больших масштабах, британская компания Nscale, занимающаяся инфраструктурой для ИИ и поддерживаемая
Оценка Runway в 5,3 млрд долларов бросает вызов Google, поскольку ИИ в области видео превосходит ИИ в области языка
В то время как большинство гигантов в сфере ИИ вкладывают миллиарды в языковые модели, стартап Runway, занимающийся генеративным видео на базе ИИ, стремительно развивается по совершенно иному пути. По





Дом






