Preguntas frecuentes
-
¿En qué se diferencian del traductor de Google?
En gran medida. Como parte de su misión de organizar la información mundial, Google se encarga de la traducción como una oferta informativa, creada muy hábilmente, si bien desde una perspectiva generalista. Su aplicación de traducción es puntera, pero se encamina hacia un portal que puede manejar las solicitudes de traducción para cualquier tema. Al igual que nos ocurrió a nosotros durante nuestros esfuerzos iniciales con la TA, Google decidió descartar enfoques de traducción automática basados en reglas en pro de métodos estadísticos para la traducción. Esto no es tan raro ya que los científicos de ambas organizaciones son fuertes defensores de la traducción automática estadística y ha habido un grado de colaboración académica entre el núcleo de I + D del equipo de PangeaMT y algunos investigadores principales de Google.
Mientras Google se centra en poner a disposición de los usuarios toda información general posible, y cuenta con amplios recursos para reunir miles de millones de palabras de datos, el enfoque de PangeaMT es construir una aplicación personalizada para sus necesidades particulares, con su terminología, expresiones y uso de vocabulario preferentes, es decir, una aplicación de traducción automática que traduce como usted desea. Normalmente, usted nos proporciona los datos para el entrenamiento y PangeaMT los potencia. Se pueden incorporar otros datos de manera que el motor cuente con suficientes recursos léxicos. Se puede construir un modelo lingüístico específico para usted o adaptado a sus fines. Además, el sistema de PangeaMT está diseñado para adaptarse y ayudar a los sistemas actuales basados en MT (memorias de traducción) al traducir en formatos TMX o XLIFF, algo que Google Translate no puede hacer (solo traduce en texto plano).
Al traducir archivos y no ya texto plano, PangeaMT se integra de forma directa y fácil en cualquier flujo de trabajo de localización o de explotación tipo Knowledge Base (base del conocimiento corporativa). Los archivos TMX o XLIFF pueden poseditarse sin dificultad con la mayoría de las herramientas de traducción asistida del pasado (si no con todas) como herramientas de edición.
En resumen, los desarrollos PangeaMT se integran en entornos de traducción actuales y automatizan los procesos en curso, mientras que Google Translate es un motor informativo.
-
Trato con textos que están llenos de etiquetas. La mayoría de los sistemas de TA estadística solo ofrece texto plano y se necesita mucho tiempo para copiar y pegar las etiquetas. ¿Han hecho algo para resolver ese problema?
Sí, efectivamente. Los sistemas de traducción automática estadística (TA estadística) normalmente producen un resultado de texto plano porque ese es el formato que pueden procesar. Sin embargo, las soluciones de PangeaMT están en uso y adaptadas a los requisitos más exigentes de la industria lingüística. Hemos centrado nuestros esfuerzos en desarrollar motores de TA estadística capaces de manejar la codificación intralineal típica de otros formatos de contenido utilizados en entornos de producción de localización. Gracias a un innovador analizador de código intralineal (in-line parser), PangeaMT puede identificar las etiquetas sin lanzarse a traducirlas. Se inserta primero un marcador de posición (placeholder) de la etiqueta que luego se reemplaza por la misma antes de sacar el texto traducido automáticamente.
Si el motor tiene que procesar texto muy cargado de etiquetas, lógicamente la calidad de la traducción puede resentirse. En situaciones así, algunos clientes prefieren apostar por la traducción y tener todos esos casos de etiquetas identificados y presentados en una posición de su elección (p. ej., principio o final del segmento), indicando entonces a sus poseditores que reinserten el código en el lugar apropiado. Otros, en cambio, optan por dejar que el motor ponga las etiquetas donde toca sin más.
La experiencia nos dice que esta es una buena medida. Desde nuestro punto de vista, nuestro analizador de código intralineal constituye una importante innovación en comparación con el nivel actual de madurez de los conocidos sistemas de TA estadística. Además, las soluciones de PangeaMT son las únicas que le proporcionan resultados en diferentes formatos, según precise (txt / TMX / XLIFF) ya que nuestra misión se basa en dos pilares: seguir una política de estándares abiertos y democratizar la traducción automática al máximo.
Visite nuestra demostración en línea donde podrá probar nuestro generador de TMX y algunas versiones ligeras de nuestros motores de traducción por campos especializados en unas cuantas combinaciones lingüísticas.
-
¿Qué quiere decir que su sistema se basa en estándares abiertos? ¿Cuál es la diferencia con otros modelos?
Significa que nuestros desarrollos siguen los estándares de toda la industria que no son propiedad de una empresa en concreto. Queremos llevar la democracia a la traducción, y en particular, al mundo de la TA. Ambos ámbitos han estado dominados por los propietarios de tecnología con un gran ojo para los negocios. Sin embargo, es un hecho en el que claramente ha habido poco interés en el avance de la industria.
Con estándares abiertos, no hay efecto “lock-in” (en este contexto, dependencia exclusiva a nivel tecnológico) ni costosas actualizaciones. Necesitará actualizar su sistema con su material poseditado, eso sí, pero esa es la propia curva de aprendizaje del sistema. Un motor se amortiza en gastos de traducción antes de un año. Una actualización con material de posedición es una fracción de ese coste.
Una vez que el desarrollo llegue a la madurez, habrá poca necesidad de mantenimiento, a menos que sea un usuario corporativo extremadamente activo y con requisitos muy específicos. Así podrá concentrarse en producir más y más material traducido o tomar en consideración la experiencia para crear motores más personalizados.
-
¿Qué pasa con la coherencia? ¿Cómo se aseguran de que la terminología de mi empresa prevalece estadísticamente frente a otras ocpiones?
Lo ideal sería que el motor personalizado solo contenga sus propios datos para asegurarse de que ningún material ruidoso perturbe su estilo de redacción o el de su empresa. No obstante, pocas organizaciones disponen de tantos datos. La recolección de información y el asesoramiento sobre la forma de obtener más datos relevantes se ha convertido en uno de los deportes favoritos de los desarrolladores de TA estadística.
Como parte de nuestros servicios de asesoramiento, PangeaMT puede añadir más potencia a su conjunto inicial de datos para que un gran corpus lingüístico forme parte del entrenamiento (es muy probable que nosotros tengamos ya unos cuantos datos para construir un modelo lingüístico o adaptar cualquiera de los nuestros a su estilo). Todos los datos que agreguemos serán relevantes para su campo del conocimiento y los motores se pondrán a prueba, tanto con estos datos incorporados como sin ellos, de manera que pueda comprobar el efecto de añadir más datos en su desarrollo. (Puede encontrar una versión resumida de cómo puede ser una prueba en una de nuestras noticias de octubre de 2009. Esto fue parte de una prueba gratuita para varias organizaciones).
En términos generales, se asume que cuantos más datos, mejor. Ha habido una cierta controversia sobre si conjuntos más pequeños y menos contaminados de datos proporcionan una mayor precisión. Esto dependerá en gran medida de su aplicación, de si el sistema requiere “conocimiento del mundo” o si está ejecutando un motor para un campo muy específico. Dos millones de palabras de datos de ingeniería civil tendrán poco impacto si usted está construyendo un sistema para el software de una compañía antivirus, o un motor médico en el que los virus serán de otra clase completamente distinta. Es un error común agregar datos y pensar que serán útiles en algún momento, pero nuestros estudios concluyen que, si la probabilidad de necesitar/recordar esos datos es baja, es mejor dejarlos como parte de su modelo lingüístico.
En resumen, no hay manera de garantizar que las estadísticas funcionen de una manera u otra (precisamente ese es el punto de la estadística, se analizan las posibilidades de que algo suceda). Si el sistema es demasiado amplio, se pueden construir sistemas de preprocesamiento y posprocesamiento (en una especie de hibridación) para “fijar” o “forzar” ciertas expresiones. Existen otras formas de trabajar hacia mayores probabilidades, ya que se puede hacer con el método combinado del motor o el de la hipótesis combinada (es decir, combinando partes de resultados probables con una certeza alta para rehacer oraciones que reprocesa el motor). Hasta ahora hemos tenido conocimiento de buenas experiencias por parte de poseditores que utilizan las mismas herramientas terminológicas presentes en las herramientas de TAO para comprobar la consistencia terminológica.
-
¿Se puede construir cualquier combinación (por ejemplo, chino o japonés al español o ruso)? ¿Cuáles son los desafíos?
Esta es la mayor ventaja de los sistemas estadísticos. Todo lo que necesita son datos, ningún conocimiento lingüístico de cómo la lengua A se relaciona con la lengua B. Si decidiera crear “reglas” entre el japonés y chino y cualquier lengua europea, tendría por delante una ardua tarea. Las reglas de transferencia son cada vez más remotas entre las lenguas no relacionadas entre sí. Pero con un sistema estadístico, su motor aprende los cambios de una palabra o serie de palabras que suceden cuando se dan otras expresiones en otros idiomas. Los sistemas de TA estadística también funcionan muy bien con lenguas similares o emparentadas, ya que el reordenamiento es mínimo. Cuando se trata de lenguas muy remotas, los procesos periféricos, el preprocesamiento y el posprocesamiento se vuelven muy importantes, así como la reorganización de palabras (es decir, hacer que la frase fluya). También es importante cómo se construye el modelo de lenguaje, pero la clave es realmente un buen sistema de preprocesamiento y posprocesamiento.
La respuesta es, por tanto, afirmativa: cualquier combinación de idiomas se puede construir y de un modo mucho más rápido y eficiente que con los sistemas basados en reglas.
-
Si utilizao TA, ¿significa que ya no puedo usar mis sistemas basados en memorias de traducción? ¿Pueden integrar TA con mi software basado en MT?
Hay varias maneras en las que se puede usar un desarrollo de TA estadística dentro de su organización. Uno de nuestros últimos desarrollos se presentó en Localization World Barcelona 2012. Esta nueva versión de PangeaMT incluye autoentrenamiento (por lo que no tiene que volver a nosotros para las actualizaciones), creación automatizada de motores, glosario y muchas otras características. Haga clic aquí para leer el comunicado de prensa. PangeaMT le ofrece:
- Un servicio completo de TA + PE, sobre todo para los usuarios corporativos que buscan una solución de conjunto. Desarrollamos el sistema de TA con sus datos y nos encargamos del desarrollo y el entrenamiento del cambio, además de la posedición de los resultados. El motor se puede alojar en cualquier sitio y produce texto sin formato. Desde 2009, ofrecemos un flujo de trabajo de TMX sin problemas, compatibilidad con XLIFF desde 2010 e integración de TTX desde 2011 con reconocimiento de % de coincidencia para que pueda aprovechar el texto de sus MT existentes utilizando su herramienta de TAO y luego pedirle al motor que haga el trabajo duro.
- Servicios tipo SaaS: desarrollamos un motor temático en el campo especializado e idioma que precise a partir de sus datos y puede utilizarlo como servicio de “pago por uso”, comprando resultados de TA que después puede poseditar a voluntad internamente en formato TMX, XLIFF o TTX. El motor está alojado internamente en PangeaMT.
Sin embargo, la implementación más popular es la adaptación de un motor que se encuentra alojado internamente en el servidor del cliente. De igual modo, desarrollamos y entrenamos un motor que se ajusta a su campo y expresiones, y utilizamos sus datos de MT y otros datos relacionados para su construcción. Este motor está instalado en su servidor, junto con un conjunto de módulos periféricos (analizador de etiquetas, interfaz web de intranet, secuencias de comandos de transferencia de datos, modelo lingüístico, etc.). De esta manera, podrá utilizar su solución de PangeaMT para traducir con la frecuencia que precise dentro de su organización. Solo existe una limitación en el número de servidores en los que se instala el motor. Hay un periodo de ajuste y adecuación del motor a su sistema y, por supuesto, se recomienda encarecidamente el reentrenamiento de este una vez haya recopilado una cierta cantidad de material poseditado.
Su software de MT existente (o cualquier otro que pudiera adquirir) puede convertirse en su entorno de posedición. Así sus lingüistas y proveedores lingüísticos habituales no tendrán necesidad de pasar por una larga curva de aprendizaje aprendiendo otra herramienta nueva. Como PangeaMT puede trabajar con un flujo de trabajo de TMX, solo tendrá que exportar esos segmentos que necesita para traducir (por lo general los que están por debajo del 70 % o 75 % de coincidencia), obtener el TMX traducido, y actualizar su proyecto penalizando al “traductor de TA”. Así, su software de memorias de traducción (MT) se detendrá cada vez que encuentre un segmento que haya sido traducido por la máquina. Alternativamente, basta con aprovechar las traducciones existentes de su MT en una herramienta de TAO utilizando XLIFF estándar abierto o TTX propietario y enviar el lote de archivos a su motor de PangeaMT para su traducción.
No podría ser más sencillo. Por lo tanto, el sistema puede interactuar fácilmente con su entorno de MT existente. La ventaja es que no es necesario actualizar el software de TAO nunca más: su sistema se dirige ya mediante la TA y mejorará con los datos que se vayan generando. Además, el sistema ofrece las ventajas de aprovechar un alto porcentaje de coincidencias de su memoria de traducción (que no tendría ningún sentido enviar a traducir mediante TA puesto que un ser humano puede detectar rápidamente la diferencia) con la potencia de un motor estadístico de dominio específico.
Una alternativa (dependiendo del software de TA que utilice) es la construcción de una API para interactuar con su software de traducción segmento tras segmento si la coincidencia de la MT no alcanza un determinado umbral.
Su ahorro en la traducción es inmediato. Con este flujo, puede entregar más contenido, más texto y llegar a más clientes.
-
¿Cuál es el retorno de la inversión en un motor de TA?
Por regla general, los motores se amortizan antes del final del primer año de funcionamiento. La misión de PangeaMT es democratizar el mundo de la traducción automática y hacer la tecnología accesible y utilizable por el mayor número posible de usuarios. Hoy en día, el coste de un motor ha pasado a ser extremadamente asequible. Así, los primeros en adoptar esta tecnología se están beneficiando más a medida que sus sistemas pueden alcanzar niveles de madurez más rápido. Esto, a su vez, significa un ahorro y la posibilidad de automatizar procesos en más idiomas y campos especializados del conocimiento. El siguiente gráfico muestra los gastos de traducir 750 000 palabras nuevas con una herramienta de TAO con una tarifa por palabra de origen de 11 céntimos. Se calculan dos actualizaciones de software bianuales.
TA estadístico = coste del entrenamiento a medida (año 1), 2 actualizaciones anuales y 750 000 palabras nuevas a un 60 % de la tarifa de traducción. “Plan de protección” a partir del año 2. *
* Incluye código intralineal (in-line parser)Costes de traducción con TAO de 750 000 palabras nuevas al año
Año 5 - 82 500 - 21 352,5
TA estadística + entrenamiento + actualización + PE de 750 000 palabras
Año 1- 82 500 - 43 912,5
Año 2 (actualización de software) - 85 500 - 22 207,5
Año 3 - 82 500 - 21 352,5
Año 4 (actualización de software) - 85 500 - 21 352,5 -
¿Qué quiere decir con reentrenamiento? ¿Es necesario actualizar los motores todo el tiempo, al igual que las memorias de traducción? ¿Cuánto cuesta?
Su motor se construirá a partir del material que tendrá que proporcionar a PangeaMT para el entrenamiento. De lo contrario, podemos utilizar el material genérico que tenemos en la mayoría de las combinaciones de idiomas. En septiembre de 2019, teníamos 4500 millones de frases alineadas en más de 80 idiomas, es decir, 3000 millones de frases para el aprendizaje automático más que en 2018, según se informa en Slator.
PangeaMT utilizará este material para refinar un modelo lingüístico para su caso particular (es decir, un motor que habla como un farmacéutico bilingüe EN/FR o un motor que habla como un ingeniero alemán bilingüe, etc.). Dependiendo del campo particular y el tamaño de sus datos bilingües, puede que se precise más contenido o que haya que generarlo. Así, el primer motor, por bueno que sea ya, se hallará en lo que llamamos “Etapa 1” (en realidad, lo denominamos un motor adolescente). Una vez que usted nos proporcione más información (normalmente un archivo TMX con traducciones previas o contenido poseditado), volvemos a entrenar al motor con más material tal y como se pretende traducir. Esto significa que el motor aprende y da mayor preferencia a ciertas expresiones, combinaciones de palabras, etc.
PangeaMT ha alcanzado 1200 millones de frases alineadas para el aprendizaje automático en 2018 y 4500 millones en 2019. El hecho de reunir grandes recursos para el aprendizaje automático le ayuda a crear motores de traducción automática de calidad casi humana con pocas entradas de texto del cliente.
El material del campo especializado se agrega generalmente al principio y al final del ciclo de entrenamiento del motor neuronal. Esto asegura que el algoritmo escoja los matices y características del ámbito, el idioma y el campo que va a traducir. Esto es cierto en especial cuando el material se añade en el momento del ciclo de entrenamiento (la última época), lo cual es altamente prioritario y, por lo tanto, sirve como “filtro de campo y estilo”.
-
¿Cuánto cuesta la posedición?
Las tendencias del mercado apuntan a una tasa del 60 % de la tarifa de traducción completa para poseditar un buen texto de salida (output) traducido automáticamente. Existen muchos aspectos que considerar alrededor de esa cifra. No podemos decir cuál es la mejor tarifa de posedición en todas las circunstancias y para cualquier campo especializado. Sin embargo, los proveedores de servicios lingüísticos y los redactores de contenido están tomando esa cifra como referencia y trabajando en pro de cifras de mejora de la producción. Sabemos además que la posedición también se está pagando por Kb, por segmento o por tiempo empleado.
-
¿Por qué TA estadística y no TA basada en reglas? ¿cuáles son las ventajas y desventajas?
Cualquier persona con experiencia en TA (o que, al menos, haya sido lector o poseditor de TA) le dirá que la traducción automática estadística (TA estadística) fluye mucho mejor que la traducción de sistemas tradicionales basados en reglas (BR). Cualquiera que haya estudiado o implementado la TA estadística le dirá que los tiempos de desarrollo e implementación son mucho más cortos (por lo tanto, hay retorno de la inversión). Un sistema BR se vende normalmente como un paquete más barato una vez que la empresa ha llevado a cabo toda la programación de reglas e integrado la sintaxis. El paquete se cierra y la personalización (o hibridación) es un proceso más largo. La TA estadística puede mejorar con reordenamiento y codificación de pares y mediante la aplicación de infinidad de otras fórmulas matemáticas y estadísticas que determinarán con certeza que una palabra (o frases o combinaciones de palabras) ocurren juntas en comparación con otras palabras. Lea más abajo si necesita un listado más amplio.
- La TA estadística solo necesita aprender de un corpus paralelo para generar un motor de traducción. En cambio, la TABR necesita una gran cantidad de conocimiento externo al corpus que solamente expertos lingüistas pueden generar, p. ej. la categorización superficial, sintaxis y semántica de todas las palabras de un idioma además de las reglas de transferencia entre lenguas. Estas últimas reglas son totalmente dependientes del par de idiomas en cuestión y, por lo general, no se estudian tanto como la caracterización de cada idioma por separado. Definir las reglas de transferencia tampoco es fácil, por lo que se necesita definir múltiples reglas en función de los casos individuales que se necesiten definir, en especial entre idiomas con estructuras muy diferentes, o cuando el idioma de partida posee una mayor flexibilidad para el manejo de los objetos estructurales en una oración.
- Un sistema de TA estadística se desarrolla rápidamente si se tiene el corpus apropiado, que también se rentabiliza así. En cambio, un sistema de TABR requiere grandes costes de desarrollo y personalización hasta que alcanza el umbral de calidad deseado. Los sistemas de TABR empaquetados se desarrollan antes de que el usuario los compre: la mayoría de los usuarios se acercan a la TA comprando programas listos al salir de la caja y para el servidor. El programa funciona y funcionará de alguna manera, si bien es extremadamente difícil reprogramar modelos y equivalencias. Sobre todo, la utilización de TABR por lo general comporta un proceso mucho más largo que incluye más recursos humanos. Este aspecto es primordial a la hora de calcular el coste total de implementación por parte de las compañías.
- La TA estadística se adapta para poder reentrenarla automáticamente y responder a situaciones no vistas con anterioridad (por citar algunas: palabras desconocidas, nuevas expresiones que se traducen de manera diferente a como se hubieran traducido antes, etc.). La TABR se “reentrena” añadiendo reglas y vocabulario nuevos, entre otras cosas, lo cual implica más tiempo/mayor implicación de “humanos expertos”.
- La TA estadística genera traducciones con mayor fluidez, si bien los sistemas puramente estadísticos pueden ofrecer menos consistencia y resultados menos predecibles si el corpus de entrenamiento es demasiado amplio para este fin. La TABR, sin embargo, puede no haber encontrado la información superficial o sintáctica, o las palabras apropiadas para analizar el idioma de partida, o no conoce la palabra. Esto le impedirá encontrar una regla apropiada.
- Mientras que la traducción automática estadística funciona bien para traducciones en un campo especializado, con el motor entrenado con un corpus bilingüe perteneciente al campo, la TABR puede funcionar mejor para campos más generales.
- La TA estadística requiere, sin lugar a duda, potentes herramientas informáticas en términos de hardware para entrenar los modelos. Son necesarios billones de cálculos durante el entrenamiento del motor. El hardware y el conocimiento computacional que se requieren para ello es altamente especializado. No obstante, hoy en día se puede reducir el tiempo de entrenamiento gracias a una mayor disponibilidad de ordenadores más potentes. La TABR requiere un tiempo de implementación y compilación más largo por parte de los expertos, por lo que, en principio, los costes de construcción también son mayores.
- La TA estadística genera patrones estadísticos automáticamente, incluyendo un buen aprendizaje de excepciones a reglas. Por lo que respecta a las reglas que gobiernan la transferencia de los sistemas de TABR, la verdad es que estas se pueden ver como casos especiales de estándares estadísticos. En cualquier caso, generalizan demasiado y no pueden manejar excepciones.
- Finalmente, los sistemas de TA estadística pueden actualizarse con información sintáctica, e incluso semántica, como la TABR. Pero en ese caso los patrones estadísticos que un sistema de TA estadística aprendería pueden verse como un tipo más general de reglas de transferencia, si bien en la actualidad la inclusión de tal información en los sistemas actuales no proporciona mejoras significativas.
- Un motor de TA estadística puede generar traducciones mejoradas si se reentrena o adapta de nuevo. En cambio, uno de TABR genera traducciones muy similares entre las diferentes versiones.
-
¿Cuántas palabras necesito para consturir un buen motor?
La mayoría le dirán que el mínimo absoluto con el que se puede crear un motor “sin florituras” son dos millones de palabras y cierto nivel de automatización dentro de un campo. Pero con esto no espere grandes resultados, especialmente si maneja textos que puedan incluir vocablos nuevos o inesperados, como sucede en la economía o el periodismo. Si maneja textos caracterizados por un lenguaje altamente controlado y de temática que presenta ligeras variaciones (manuales técnicos, paquetes fijos de documentación, etc.), intente introducir la mayor cantidad de texto posible.
Los desarrollos de PangeaMT típicos para ámbitos especializados (software, electrónica, automoción, ingeniería, turismo) se suelen iniciar con 5 millones de palabras. Hay varias maneras de aumentar el número de palabras mediante la captura de textos paralelos fiables. PangeaMT le ofrece asesoramiento y orientación para que pueda alimentar un motor con tantas palabras como sea posible. Denominamos “maduro” a un motor cuando cuenta con 15 o 20 millones de palabras dentro de un ámbito, puesto que es muy probable que ya contenga toda la terminología necesaria para ese campo. No se desespere si no tiene tantos datos. Lo importante es comenzar a entrenar el motor. Puede añadir texto poseditado y otros materiales que pueda ir obteniendo con la experiencia en reentrenamientos posteriores.
Se ha argumentado mucho acerca de la “efectividad irracional de enormes cantidades de datos” frente a “cantidades más pequeñas de datos bien seleccionados”. La mayoría de la gente que se plantea un desarrollo de la TA por primera vez no está segura de si les conviene más poner la mayor cantidad de texto posible (enormes cantidades de datos) o seleccionar los textos bilingües más exactos incluso aunque eso suponga tratar con conjuntos de datos más pequeños. Nuestra experiencia apunta a diferentes direcciones:
- si tiene por objeto construir un motor de tipo más general, capaz de traducir lo inesperado (desde artículos periodísticos a textos económicos y literatura), recabe tantos datos como le sea posible. Por decirlo de alguna forma, está tratando de construir un sistema válido tanto para los días de sol como para los de lluvia. Nunca habrá un número suficiente de palabras. Tarde o temprano necesitará incorporar algún tipo de ayuda sintáctica.
- si está tratando de construir un motor que se ajuste a un campo lingüístico y a unas necesidades particulares (o incluso si desea un motor que comprenda sus productos y servicios, así como cierta información financiera y legal), no necesita trillones de datos. En tal caso, recopilar tantos datos como pueda de su organización (o afines) resulta más razonable y merece la pena.
De una manera u otra, no infravalore el esfuerzo y trabajo en equipo necesarios durante las etapas de recopilación de datos, ya que son esenciales para el buen entrenamiento (y, por tanto, para los resultados) del motor. Será el principio del cambio en su adopción de tecnologías de TA y una buena oportunidad para involucrar a diferentes personas en el proceso.
-
¿En qué idiomas puedo realizar mi traducción?
Contamos con una BBDD con +700 pares de idiomas de todo el mundo.
-
¿Cuánto tarda en hacerse la traducción?
Depende de como se realice la traducción y del contenido. Si realiza una traducción desde el panel de la plataforma, la traducción es instantánea, en cambio si lo hace subiendo un archivo, esta puede durar de 1 a 10 minutos en función del contenido que contenga.
-
¿Qué tipo de documentos puedo traducir automáticamente en ECO?
En nuestra plataforma podrá subir archivos en distintos formatos: cualquiera proveniente del paquete de Microsoft Office, pdf y txt.