OmegaT

電腦輔助翻譯工具

OmegaT是一個使用Java程式語言編寫的電腦輔助翻譯工具。它是自由軟體,最初的開發由Keith Godfrey在2000年進行,目前的開發工作由Didier Briel帶領的團隊進行。OmegaT名稱在德國是註冊商標。

OmegaT
OmegaT 1.6 under Mac OS X
原作者Keith Godfrey
開發者Didier Briel, Alex Buloichik, Zoltan Bartko, Tiago Saboga等
首次釋出2002年11月28日 (2002-11-28)
目前版本
  • 4.3.3(2022年3月18日;穩定版本)[1]
  • 5.7.1(2022年3月18日;測試版本)[2]
  • 5.8.0(2023年4月23日)[3]
編輯維基數據鏈結
原始碼庫 編輯維基數據鏈結
作業系統跨平台Java
類型電腦輔助翻譯
授權條款GPL
網站omegat.org

OmegaT適用於專業譯員。它的功能包括使用正規表示式的可自訂分段,帶有模糊匹配和匹配傳播的翻譯記憶,術語庫匹配,詞典匹配和參考資料搜尋以及使用Hunspell拼寫詞典的行內拼寫檢查功能。

OmegaT可執行於LinuxMac OS XMicrosoft Windows 98 SE或更高版本,[4]並且需要Java 1.5。它的介面和文件被翻譯成29種語言。在2010年對458名專業譯員的調查[5]表明,OmegaT的使用者數達到Wordfast、DejaVu和MemoQ的1/3,且達到了市場領導者塔多思的1/8。在Bing翻譯的合作夥伴中,OmegaT是其中唯一一個免費的專業級輔助翻譯工具[6]

歷史

OmegaT最初由Keith Godfrey開發於2000年。當時使用C++進行編寫。

在2001年二月[7]首次公開發布的版本使用Java寫成。在這個版本中使用專有翻譯記憶庫格式。它能翻譯無格式的純文字檔案、HTML以及執行塊級別的分割規則(即分割成段落而不是句子)。

開發和軟體的釋出

OmegaT的開發代管在SourceForge。開發團隊由Didier Briel領導。和許多開源專案一樣,新版本的OmegaT會頻繁釋出,通常每個新版本含有2-3個錯誤修改和功能升級。這個指的是「標準」版本,其中總是含有完整的使用者手冊和包含一些還未寫入使用者手冊的功能的「最新」版本。[8]可以從Sourceforge的代碼版本庫的更新源進行更新。[9]

OmegaT的工作原理

對於每個翻譯任務,OmegaT會建立包含指定檔案的專案資料夾的集合。使用者把未翻譯文件複製到其中的/source/子資料夾,而在翻譯結束後,已翻譯的文件會出現在/target/子資料夾中。OmegaT會在編輯窗格的片段中顯示已分段的源文件的可翻譯內容供使用者翻譯。

在開始翻譯前,使用者還可以複製以前的翻譯記憶到/tm/子資料夾,複製術語庫到/glossary/資料夾以及複製StarDict詞典到/dictionary/資料夾,在翻譯時OmegaT會自動查閱它們。

進行翻譯時,OmegaT會自動檢查以前的翻譯以尋找類似的句子,找到後會顯示在模糊匹配窗格中。譯員可以使用快速鍵把模糊匹配插入到編輯窗格。OmegaT還會查閱使用者預先添加到專案資料夾的術語庫和詞典。如果啟用了機器翻譯,例如谷歌翻譯,那麼它會顯示在單獨的機器翻譯窗格。

翻譯結束後,OmegaT會建立已翻譯的檔案,並匯出專案當前的翻譯到TMX檔案中,這樣這些檔案可以在以後翻譯時重用或者和其他使用OmegaT或其他CAT工具的譯員進行交換。

OmegaT的功能

OmegaT擁有主流CAT工具具有的許多功能。包括建立,匯入和匯出翻譯記憶,使用翻譯記憶進行模糊匹配,查詢術語表、索引定位和一致性搜尋。

OmegaT還擁有其他CAT工具不具有的功能,包括:

  • OmegaT可以同時翻譯不同檔案格式的多個檔案,且查閱多個翻譯記憶、術語表和詞典(只受電腦可用主記憶體的限制)。
  • 通過支援的檔案類型,OmegaT允許使用者自訂副檔名和檔案編碼。對於一些文件類型,使用者還可以有選擇地翻譯哪些元素(例如對於OpenOffice.org Writer檔案,可選擇是否翻譯書籤;對於Microsoft Office 2007/2010 檔案,可選擇是否翻譯註腳;而對於HTML,可選擇是否翻譯圖像的ALT文字)。使用者還可以選擇如何處理第三方翻譯記憶中的非標準元素。
  • OmegaT的片段分割規則基於正規表示式。可以組態片段分割規則基於語言或檔案格式,而連續的片段分割規則繼承彼此的值。
  • 在編輯窗口,使用者可以直接跳到下一個未翻譯片段或在歷史中前進以及後退。使用者可以復原和重做,複製和貼上,以及用與進階文字編輯器相同的方式切換大小寫狀態。使用者可以選擇檢視已翻譯片段的源文字。編輯窗格還含有使用Hunspell詞典的行內拼寫檢查功能以及使用滑鼠進行互動地拼寫檢查。
  • 使用者可以使用鍵盤快速鍵或滑鼠插入模糊匹配。OmegaT使用彩色顯示模糊匹配的相似度。OmegaT還可以顯示翻譯了任意指定片段的日期、時間和使用者名稱。匹配的術語可以用滑鼠插入。使用者可以選擇把源文字複製到目標文字區域或自動插入最接近的模糊匹配。
  • 在搜尋窗口,使用者可以選擇搜尋當前檔案的源文字,目標文字,其他翻譯記憶和參考檔案。搜尋可以是區分大小寫的,還可以使用正規表示式。雙擊搜尋結果可以直接跳轉到編輯窗口中的相應片段。
  • 翻譯完成後,OmegaT可以執行標籤檢驗以確保沒有意外的標籤錯誤。OmegaT可以在專案開始前統計專案檔案和翻譯記憶的狀態,以及在翻譯期間顯示翻譯任務的進度。
  • OmegaT可以從ApertiumBelazar以及Google翻譯取得機器翻譯並顯示在單獨的窗口中。
  • 在OmegaT使用者介面中可以對各個窗口向周圍移動、最大化、平鋪、標籤化和最小化。當OmegaT啟動時會顯示「快速入門指南」的簡短精靈。

支援的文件格式

OmegaT支援直接翻譯多種檔案類型。OmegaT根據副檔名來確定檔案類型。可以自訂副檔名關聯的處理方式和首選的編碼來覆蓋預設設定。

OmegaT把格式轉換成標籤來處理含格式的文件,類似於其他商業的CAT工具。

直接支援的格式

OmegaT可以直接翻譯下列格式:

檔案格式 副檔名模式
文件格式
使用任意 Java 可處理的編碼(包括Unicode)的文字
所有純文字衍生格式,如 DokuWiki, MediaWikiMarkdown
.txt, .txt1, .txt2, .utf8, .md
HTML/XHTML .html, .htm, .xhtml, .xht
OpenDocument (ODF),[10]用於LibreOfficeStarOfficeOpenOffice .sx?, .st?, .od?, .ot?
Microsoft OOXML .doc?, .xls?, .ppt?
幫助和手冊頁 .xml, .hmxp
HTML 幫助編譯器 .hhc, .hhk
LaTeX .tex, .latex
QuarkXPress CopyFlow Gold .tag, .xtg
DocBook .xml, .dbk
在地化資源格式
Android 資源 .xml
Java properties .properties
Typo3 LocManager .xml
Mozilla DTD .dtd
Windows 資源 .rc
WiX 在地化 .wxl
ResX .resx
Key=Value結構的檔案 .ini, .lng
多語言在地化格式
XLIFF .xlf, .sdlxliff
Portable Object (PO) .po, .pot
其他格式
SubRip 字幕 .srt
SVG 向量圖 .svg

值得注意的是,OmegaT 還提供 MediaWiki 匯入功能。

間接支援的格式

有兩種方式讓OmegaT處理不支援的格式:

  • 把這種格式的副檔名註冊到首選的檔案過濾器 (通常是帶格式的純文字)
    • 在這之後可以使用分段設定正規表示式來最佳化結果
  • 把這種格式轉換為直接支援的格式

對於XLIFF的支援

Okapi Framework中的Rainbow程式可以把某些檔案格式轉換成OmegaT支援的XLIFF格式。Rainbow還可以從這類文件中建立完整的OmegaT專案資料夾,便於OmegaT的處理。[11]

對於Gettext PO的支援

一些檔案格式可以轉換為能在OmegaT中翻譯的Gettext Portable Object (PO) 檔案。Debian Linux 中的po4a程式可以把類似LaTeXTeX以及POD的格式轉換為Gettext PO。[12]Translate Toolkit可以把Mozilla .properties 和dtd檔案、CSV 檔案、某些Qt .ts檔案以及某些XLIFF檔案轉換為Gettext PO。


對於Office Open XML和ODF的支援

從版本97到2003的Microsoft Word、Excel以及PowerPoint文件可以轉換為Office Open XML (Microsoft Office 2007/2010)或ODF (OpenOffice.org)格式。這種轉換過程並不是無失真的,可能導致某些格式的遺失。

對於Trados® .ttx檔案的支援

Trados® .ttx可以使用Okapi TTX Filter頁面存檔備份,存於網際網路檔案館)進行處理。

支援的翻譯記憶和術語庫格式

TMX格式的翻譯記憶

OmegaT的內部翻譯記憶格式對使用者不可見,但每次它自動儲存翻譯專案時,會自動把所有新增和更新的翻譯單元都匯出並添加到三個外部的TMX翻譯記憶:一個原生的OmegaT TMX、一個級別1的TMX以及一個級別2的TMX。

  • 原生的TMX是為了用於OmegaT中的專案。
  • 級別1的TMX檔案保留了文字資訊,可以用在支援TMX級別1和2的CAT工具中。
  • 級別2的檔案保留了文字資訊和相應的行內標籤資訊,可用在支援TMX級別2的CAT工具中。

匯出的級別2檔案包含了封裝在TMX標籤中的OmegaT內部標籤,這樣的TMX檔案可以在支援TMX級別2的CAT工具中生成匹配。在Trados和SDLX中測試通過。

OmegaT支援匯入最高1.4b版本級別1和級別2的TMX檔案。在OmegaT中匯入級別2的檔案會生成相同級別的匹配,因為OmegaT會把外部的TMX標籤轉換為TMX級別2的標籤。對於由Transit建立的TMX檔案測試又通過了。

術語庫

對於術語庫,OmegaT主要使用tab分隔的UTF-8編碼且副檔名為.txt的純文字檔案。術語庫檔案的結構非常簡單:首列包含源語言詞語,第二列包含對應的目標語言詞語,第三列(可省略)與詞語相關的上下文注釋等。文字編輯器中可以很容易建立這樣的術語庫。

還支援使用標準CSV格式的類似結構的檔案,對於TBX檔案同樣如此。

社群使用者的參與

OmegaT專案

The OmegaT Project is a sort of 「computer literacy」 group that focus on translators' needs. Users are encouraged to contribute tools written by themselves in response to translators' needs which are not yet addressed by the main OmegaT program itself.[13]

OmegaT的在地化

OmegaT的使用者介面和文件已經被翻譯為大約30種語言。志願翻譯人員可以翻譯使用者介面,「快速入門指南」簡短精靈或完整的使用者手冊(或者所有的三個部分)。所有的語言檔案和使用者手冊的翻譯都包含在標準的OmegaT釋出程式中。

使用者建立的程式

OmegaT使用者社群的特色是對於OmegaT的不足之處經常提示使用者建立實現那些功能的宏、指令碼和程式,儘管有時某些功能後來會成為OmegaT自身的一部分。當OmegaT只能進行段落分割時,有使用者建立了OpenOffice.org宏進行根據句子進行分割。當在OmegaT中自動平衡多個TM仍需合併TM時,有使用者建立了TMX合併指令碼。當OmegaT沒有提供拼寫檢查支援時,有多個使用者建立指令碼或找到解決方案作為OmegaT的一部分用來在翻譯過程中提供拼寫檢查功能。[14]

當前提供了某些功能且尚未內建於OmegaT的工具包括一個用於Trados TagEditor檔案的轉換程式,兩個簡單的對齊器,一個不工作的術語添加工具以及一個把標籤視為預留位置的工具。[15]

基於OmegaT構建的其他軟體

Autshumato translation suite

Autshumato套件包含CAT工具,雙語對齊器,PDF提取器,TMX編輯器和基於抓取資料的公共TM。最終的版本將包含術語管理器和機器翻譯程式。其中的CAT工具是以OmegaT為基礎構建的,且需要OpenOffice.org才能執行。它的開發資金由南非政府的藝術和文化部門提供。[16]

Benten

Benten是基於XLIFF的Eclipse。它使用OmegaT代碼來處理翻譯記憶匹配過程。它的部分開發資金由日本政府提供。[17]

Boltran

Boltran是模仿OmegaT專案工作流程的基於網路的獨立CAT工具。它基於開源的OmegaT構建,因此能翻譯任何OmegaT可以翻譯的內容,且含有與OmegaT幾乎等同的術語管理和模糊匹配能力。目前,唯一公開的Boltran伺服器是開發者的網站,但在理論上任何人都可以建立公開或私有的Boltran伺服器。[18]

OmegaT+

OmegaT+ 是在 2005 年從 OmegaT 的 1.4.5 版本衍生而來的 CAT 工具。其工作方式類似於 OmegaT,同時開發了一些自己的功能,且使用了與 OmegaT 不相容的專案格式[19]。在許多時候,這個名稱容易讓不了解的人誤以為是 OmegaT 的增強版本,而實際上 OmegaT+ 只是 OmegaT 1.4.5 的增強版本,且從 2005 年至今 OmegaT 中已增加了大量功能增強和新特性。

使用者評價

另請參閱

參考

  1. ^ https://github.com/omegat-org/omegat/releases/tag/v4.3.3; 出版日期: 2022年3月18日; 檢索日期: 2022年5月27日.
  2. ^ https://github.com/omegat-org/omegat/releases/tag/v5.7.1; 出版日期: 2022年3月18日; 檢索日期: 2022年5月27日.
  3. ^ Release 5.8.0. 2023年4月23日 [2023年4月26日]. 
  4. ^ 存档副本. [2010-10-24]. (原始內容存檔於2010-03-22). 
  5. ^ 存档副本. [2012-01-14]. (原始內容存檔於2012-02-29). 
  6. ^ 存档副本. [2013-12-21]. (原始內容存檔於2013-11-28).  Microsoft Translator Partners
  7. ^ 存档副本. [2012-01-14]. (原始內容存檔於2010-12-04). 
  8. ^ [1]頁面存檔備份,存於網際網路檔案館) OmegaT's "standard" and "latest" versions
  9. ^ [2] Archive.is存檔,存檔日期2012-07-17 The latest source files are always available from the Sourceforge code repository
  10. ^ Open Document Format for Office Applications頁面存檔備份,存於網際網路檔案館) – ISO/IEC 26300:2006 format
  11. ^ Okapi Framework頁面存檔備份,存於網際網路檔案館) – Text Extraction utility can create an OmegaT project folder tree
  12. ^ po4a頁面存檔備份,存於網際網路檔案館) – A conversion utility to and from the Portable Object format, perl application packaged under Debian
  13. ^ OmegaT Getting Involved頁面存檔備份,存於網際網路檔案館) – Translators are encouraged to write their own supplementary tools
  14. ^ 存档副本. [2012-01-14]. (原始內容存檔於1998-11-30). 
  15. ^ 存档副本. [2012-01-14]. (原始內容存檔於2012-02-08). 
  16. ^ Autshumato. [2012-01-14]. (原始內容存檔於2009-11-11). 
  17. ^ Benten. [2012-01-14]. (原始內容存檔於2012-01-12). 
  18. ^ Boltran. [2012-01-14]. (原始內容存檔於2012-01-24). 
  19. ^ OmegaT+. [2012-01-14]. (原始內容存檔於2010-02-07). 

外部連結

使用者群組