EL TRADUCTOR DE GOOGLE AÑADE 110 NUEVOS IDIOMAS GRACIAS A LA INTELIGENCIA ARTIFICIAL
- By MarceloToapanta
- Contenidos
- Visitas: 282
El 27 de junio de 2024, Google anunció la incorporación de 110 nuevos idiomas a su traductor, utilizando modelos avanzados de inteligencia artificial. La compañía estima que estos idiomas adicionales son hablados por aproximadamente 614 millones de personas, representando cerca del 8% de la población mundial.
Gracias a PaLM 2, un modelo de lenguaje lanzado en mayo de 2023, Google ha logrado la "expansión más grande hasta ahora" en su traductor. Entre los nuevos idiomas, algunos son hablados por más de 100 millones de personas, mientras que otros son usados en pequeñas comunidades, incluyendo idiomas indígenas y lenguas con pocos hablantes nativos.
En 2022, Google añadió 22 lenguas a su servicio de traducción, elevando el total a 133 idiomas. En esa ocasión, se incluyeron lenguas como el Aymara, Guaraní y Quechua, además de varios idiomas de India y África. Esta expansión actual lleva el total a 243 idiomas disponibles en el Traductor de Google.
Google inició en 2022 la Iniciativa de los 1.000 Idiomas, un proyecto ambicioso que busca que la inteligencia artificial pueda ser utilizada con las 1.000 lenguas más habladas del mundo. Esta iniciativa ha permitido la inclusión de idiomas diversos, proporcionando acceso a traducciones a comunidades que antes no tenían esta herramienta.
Google destacó siete idiomas principales en esta expansión debido a la cantidad de hablantes y la documentación disponible para entrenar a los modelos de IA:
- Afar: Idioma tonal hablado en Djibuti, Eritrea y Etiopía.
- Cantonés: Muy solicitado y con similitudes con el Mandarín, representó un desafío para los modelos de IA.
- Manx: Idioma céltico de la Isla de Man, casi extinto en 1974, pero ahora en proceso de recuperación.
- NKo: Lengua mandinga de África occidental con un alfabeto único inventado en 1949.
- Punjabi (Shamukhi): Variedad del Punjabi con escritura perso-arábica, el idioma más hablado en Pakistán.
- Tamazight (Amazigh): Idioma berber del norte de África con dialectos variados y escrituras latinas y Tifinagh.
- Tok Pisin: Idioma criollo basado en el inglés usado en Papúa Nueva Guinea.
Además de los mencionados, otros 103 idiomas se suman a la lista, incluyendo:
- Abkhaz
- Acehnés
- Acholi
- Alur
- Avar
- Awadhi
- Balinés
- Baluchi
- Baoulé
- Bashkir
- Batak Karo
- Batak Simalungun
- Batak Toba
- Bemba
- Betawi
- Bikol
- Breton
- Buryat
- Chamorro
- Chechen
- Chuukés
- Chuvash
- Crimean Tatar
- Dari
- Dinka
- Dombe
- Dyula
- Dzongkha
- Faroés
- Fijian
- Fon
- Friulian
- Fulani
- Ga
- Hakha Chin
- Hiligaynon
- Hunsrik
- Iban
- Jamaican Patois
- Jingpo
- Kalaallisut
- Kanuri
- Kapampangan
- Khasi
- Kiga
- Kikongo
- Kituba
- Kokborok
- Komi
- Latgalian
- Ligurian
- Limburgish
- Lombard
- Luo
- Madurés
- Makassar
- Malay (Jawi)
- Mam
- Marshallés
- Marwadi
- Mauritiano criollo
- Meadow Mari
- Minang
- Nahuatl (Huasteca oriental)
- Ndau
- Ndebele (Sur)
- Nepalbhasa (Newari)
- Nuer
- Occitan
- Ossetian
- Pangasinan
- Papiamento
- Portugés (Portugal)
- Q'eqchi'
- Romaní
- Rundi
- Sami (Norte)
- Sango
- Santali
- Seychellés criollo
- Shan
- Siciliano
- Silesiano
- Susu
- Swati
- Tahitian
- Tamazight (Tifinagh)
- Tetum
- Tibetano
- Tiv
- Tongano
- Tswana
- Tulu
- Tumbuka
- Tuvan
- Udmurt
- Venda
- Veneciano
- Waray
- Wolof
- Yakut
- Maya Yucateca
- Zapoteca