У межах створення Нацкорпусу кримськотатарської мови опрацьовано понад 700 матеріалів

Під час роботи над створенням Національного корпусу кримськотатарської мови, яке ініціювало Міністерство з питань реінтеграції тимчасово окупованих територій, фахівці вже опрацювали понад 700 матеріалів.

Про це повідомляє пресслужба Мінреінтеграції, передає Укрінформ.

“Збір друкованих та електронних текстів кримськотатарською мовою для їх подальшого імпорту на платформу Sketch Engine розпочався з жовтня 2022 року. За майже пів року були опрацьовані та внесені до каталогу понад 700 матеріалів. Серед них – твори кримськотатарських авторів, журнали, газети, підручники, документи міжнародних організацій, субтитри фільмів тощо», – йдеться у повідомленні.

Зазначається, що за цей час також розроблено словник лематизації – ідеться про створення реєстру (бази даних) слів з позначенням їх початкової форми та мовних характеристик, що потрібно для запуску модуля з пошуку слів на онлайн-платформі.

Розробка відповідного програмного забезпечення триває.

Реклама

Ви досі не підписані на телеграм-канал Літгазети? Натисніть, щоб підписатися! Посилання на канал

Як повідомлялося, Мінреінтеграції ініціювало створення Національного корпусу кримськотатарської мови (НККМ) у межах реалізації Стратегії розвитку кримськотатарської мови на 2022-2032 роки. НККМ – це онлайн-платформа для дослідження мови, що працюватиме на даних із текстових матеріалів кримськотатарською.

Поєкт реалізується за підтримки швейцарсько-української Програми EGAP, що виконується Фондом Східна Європа, та Київського національного університету імені Тараса Шевченка.