AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Grammarly створила перший анотований GEC-корпус української мови і виклала його у відкритий доступ

21.01.2021
Share on FacebookShare on Twitter

Grammarly створила перший анотований GEC-корпус української мови і виклала його у відкритий доступ

Этоинтересно

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

07.07.2025
MSI Vector 16 HX AI — ноутбук для тех, кто хочет всё и сразу

MSI Vector 16 HX AI — ноутбук для тех, кто хочет всё и сразу

07.07.2025

Компанія Grammarly, яка розробляє онлайн-сервіс на основі штучного інтелекту для допомоги в написанні текстів англійською мовою, анонсувала створення та публікацію у відкритому доступі першого анотованого GEC-корпусу української мови.

GEC — це Grammatical Error Correction, тобто виправлення граматичних помилок, а мовний корпус — сукупність текстів, авторами яких є звичайні люди. Професійні українські лінгвісти ці тексти потім опрацювали (проанотували — позначили помилки і вказали відповідні виправлення). Призначення корпусу — наукове та практичне вивчення мови. Схожі корпуси існують для багатьох мов, але до сьогодні не було такого анотованого корпусу для вивчення української мови.

Grammarly створила перший анотований GEC-корпус української мови і виклала його у відкритий доступ

Презентований GEC-корпус української мови налічує понад тисячу різножанрових текстів (а це більш ніж 20 000 речень), що їх написали майже 500 волонтерів з усієї України і з-за кордону. Ці дані будуть корисні тим, хто цікавиться лінгвістикою, — від студента-науковця до приватної компанії — і для дослідницької роботи, і для створення або поліпшення власного онлайн-додатка, продукту тощо. Завантажити корпус можна за наступним посиланням.

Окрім того, проєкт зі збору та наповнення GEC-корпусу української мови стає постійним у компанії Grammarly і буде частиною внеску Grammarly у розвиток українського NLP (natural language processing — опрацювання природної мови). Команда розробників продовжить наповнювати корпус текстами за допомогою вебсайту проєкту, а також працюватиме над удосконаленням його технічної цінності, щоб збільшити його значення для наукової спільноти.

“Ми вбачаємо в цьому проєкті особливу цінність для розвитку української комп’ютерної лінгвістики та української мови онлайн і саме тому ухвалили рішення зробити цей проєкт постійним для нашої компанії. Якщо підсумувати простими словами значення цієї ініціативи, то це один із маленьких кроків, які наближають нас до чудової мети — навчити комп’ютер ще краще розуміти українську мову. Саме це надихає всю нашу команду!» — коментує Настасія Осідач, менеджерка команди комп’ютерних лінгвістів Grammarly та керівниця проєкту зі збору корпусу.

Корпус також може мати позитивний вплив на створення нових онлайн-систем виправлення граматики в українськомовних текстах. Українська мова входить до 50 найпоширеніших мов світу; водночас якісних текстових ресурсів для дослідження української зараз існує небагато. Створений корпус надає українській дослідницькій спільноті ще один інструмент для опрацювання природної мови і може прискорити розвиток українських комунікаційних асистентів. Також GEC-корпус буде сприяти використанню якісної української мови в онлайні, а таклж буде корисним для наукової спільноти, адже надасть більше інструментів для досліджень та в результаті буде корисним для тих, хто спілкується українською онлайн.

“Ми зробили GEC-корпус загальнодоступним, тож беріть його, досліджуйте та розвивайте комп’ютерне опрацювання української мови! Окрім доповнення самого корпусу текстами, команда активно вдосконалюватиме його технічну цінність. Наші лінгвісти підготують додатковий варіант анотації, що дасть змогу використовувати корпус у двох різних завданнях: виправленні тільки граматики та виправленні граматики й стилю, що суттєво збільшує можливості його використання та значення”, — каже Олексій Сивоконь, інженер-дослідник Grammarly.

Дізнатися більше і підтримати проєкт GEC-корпусу української мови можна за наступним посиланням.

Джерело: Grammarly

Другие новости

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

07.07.2025
MSI Vector 16 HX AI — ноутбук для тех, кто хочет всё и сразу

MSI Vector 16 HX AI — ноутбук для тех, кто хочет всё и сразу

07.07.2025
Смартфон за 1500 евро, который даже не способен загрузиться. Sony снимает с продажи флагманский Xperia 1 VII из-за технических проблем и критики пользователей

Смартфон за 1500 евро, который даже не способен загрузиться. Sony снимает с продажи флагманский Xperia 1 VII из-за технических проблем и критики пользователей

07.07.2025
ИИ-помощник Copilot теперь ищет файлы на Windows 10 и 11 — лучше и быстрее Windows Search

ИИ-помощник Copilot теперь ищет файлы на Windows 10 и 11 — лучше и быстрее Windows Search

07.07.2025
Илон Маск объявил о создании политической партии

Илон Маск объявил о создании политической партии

07.07.2025
Рецензия на сериал «Железное сердце» / Ironheart

Рецензия на сериал «Железное сердце» / Ironheart

06.07.2025
Next Post
Motorola Edge S: живые фото, характеристики и результаты AnTuTu

Motorola Edge S: живые фото, характеристики и результаты AnTuTu

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Почему нам кажется, что сердце находится слева

    Почему нам кажется, что сердце находится слева

    51 shares
    Share 20 Tweet 13
  • Когда ИИ доводит до самоубийства: OpenAI изучает влияние ChatGPT на психическое состояние людей

    1 shares
    Share 0 Tweet 0
  • Google незаконно собирала данные со смартфонов в периоды отсутствия активности, за что была оштрафована на 314 млн долларов

    1 shares
    Share 0 Tweet 0
  • Обзор гарнитуры Jabra Evolve2 85

    8 shares
    Share 3 Tweet 2
  • Геймер превратил авто Honda CR-V в контроллер для Need for Speed Underground

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

Космический «канат» во всей красе: на Солнце зафиксирован уникальный выброс плазмы — протуберанец размером 1 миллион километров в длину необычной формы

07.07.2025
Vivo X200 Ultra получает апдейт с улучшениями камер

Vivo X200 Ultra получает апдейт с улучшениями камер

07.07.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить