기업용 기계 번역 솔루션
방대한 양의 데이터를 처리하는 기계 번역 엔진
미국
개요
다국어 음성 녹음, 텍스트 및 문서가 처리되어 법적 절차의 사실을 구성하는 관련 정보를 추출할 수 있는 NLP를 사용하여 검색 가능한 단일 문서 데이터베이스로 생성됩니다.
과제
법적 사건의 진행 과정에서 개인용 컴퓨터, 음성 녹음기 및 인쇄된 텍스트의 내용이 저장됩니다.
필사된 언어 자원의 양은 셰익스피어 전집의 350배에 해당했습니다. 다국어로 된 방대한 자료에서 필요한 정보를 찾아내기 위해 자동화 솔루션이 필요했습니다.
판지아닉의 솔루션
기업용 언어 솔루션은 음성과 텍스트를 처리하는 다양한 신경망으로 구성됩니다. 이 과정에는 다음이 포함됩니다:
-
필사, 음성 텍스트 변환.
-
번역, 모든 언어 자원의 영어 단일 언어 버전 생성.
-
감정 분석, 텍스트 발췌 내용의 긍정적/부정적 관련성 탐지.
-
요약, 단락을 짧은 문장으로 추상화.
-
색인화, 문서 묶음 내에서 엔터티(사람, 조직, 날짜, 장소, 금액, 키워드) 찾기 및 참조.
-
분류, 문서를 등급, 카테고리 및 관련성에 따라 정렬 및 분류.
기술
작동 방식?
기업용 솔루션은 고객사 현장의 2~3대 서버에서 실행됩니다. 외부 제3자와의 상호작용이 필요하지 않으며, 정보는 고객사의 데이터 센터에 보관됩니다.
-
다양한 형식의 리소스가 입력 영역에 로드되고 첫 번째 프로세스에서 리소스를 단일 형식 텍스트로 전환합니다:
◦ 이미지/래스터 파일은 OCR 처리됩니다.
◦ 음성은 필사되며, 발화자가 감지되고 참조됩니다.
◦ PDF, Word 및 PowerPoint 형식은 모두 일반 텍스트 파일로 변환됩니다.
-
언어 감지 및 번역: 문단 수준에서 언어가 감지되고, 영어가 아닌 경우 소스 언어에서 영어로 번역하도록 설계된 신경망을 통해 텍스트가 처리됩니다.
-
특정 신경망이 단일 언어 입력을 받아 관련 결과(감정, 중요도, 참조 엔터티 등)와 원시 데이터에서 참조를 찾을 수 있는 그래프 모델을 생성합니다.
지원 서비스는 데이터가 신경망으로 들어가고 나오는 협업 워크플로를 관리하며 하드웨어 및 소프트웨어 리소스를 효율적으로 활용할 수 있도록 작업 부하를 분산합니다.
혜택
때로는 데이터가 너무 많아 기존의 리소스를 사용하여 관련 정보를 찾는 것이 불가능할 수 있습니다.
비용 절감과 신속한 처리 시간은 언어 리소스의 자동 분석을 고려할 강력한 이유입니다.
저희는 판지아닉의 업무 윤리와 전문성을 높이 평가합니다. 그들은 고객의 의견을 적극적으로 경청하며, 이를 통해 매일 최고의 맞춤형 언어 솔루션을 제공할 수 있습니다. 제 관점에서 이는 판지아닉의 가장 큰 장점 중 하나입니다.
판지아닉은 번역 과정을 쉽게 만들어줍니다... 또한 친절하고 신속한 번역 서비스를 제공합니다. 모든 번역을 위한 데이터베이스를 생성한 것은 특히 유용했으며, 이를 통해 번역을 재사용하고 다른 경우나 유사한 작업에서 콘텐츠를 재활용할 수 있었습니다.
품질은 언제나처럼 뛰어납니다. 번역 과정에서 원문이 여러 번 변경되었지만, 판지아닉은 변화에 신속하게 대응해 주었고 큰 도움이 되었습니다.