Еврокомиссия бесплатно выложила в интернет тексты общим объемом в миллион предложений. Каждое из предложений качественно переведено на 22 из 23 языков Евросоюза.
Ожидается, что корпус текстов особенно поможет программистам, разрабатывающим системы автоматического перевода и проверки орфографии.
Основную часть корпуса составили законы ЕС. Ведомства Евросоюза постоянно переводят документы, так как правила требуют, чтобы каждый закон ЕС существовал в 23 вариантах - по числу официальных языков блока.
Служащие Еврокомиссии работают с 253 языковыми парами и переводят по полтора миллиона страниц в год. Всего в Еврокомиссии трудится 1750 переводчиков, отмечает PC World.
В корпусе текстов не хватает перевода на ирландский язык. Когда он появится, не сообщается.
Одной из самых известных систем автоматического перевода, использующих параллельные тексты на разных языках, является Google Translate. Основой ее работы являются документы ООН и Европейского союза.