>Teknologi Penerjemahan: Machine Translation dan Translation Memory

>

Oleh: Sugeng Hariyanto[*]
“Translation is a fine art. Translation tools are not a substitute for a professional translator. However, professional translators have come to depend on translation tools to assist them in working more efficiently, in remaining competitive and in providing consistent, high-quality translations. Clients now expect translators to use these available tools for the same reasons. “
(Beshar Bahjat is a localization engineering manager at InterPro Translation Solutions)
Pembuka
Di dalam sejarahnya, teks telah berkembang dari linier menjadi non-linier, dari satu media (tulisan) menjadi multimedia (tulisan, suara dan gambar), dari cetakan-di-atas-kertas (buku kertas) menjadi kode digital di server internet (laman web) dan di monitor banyak perangkat (antarmuka pengguna). Bukan hanya jenis teks yang berkembang, jumlah teks yang harus diterjemahkan juga bertambah. Penerjemahan teks dengan volume tinggi ini juga harus dilakukan dengan cepat agar pesan dapat segera dikomunikasikan kepada pembaca dengan berbagai pertimbangan. Di lain pihak, manusia mempunyai keterbatasan tenaga, pikiran, daya ingat, dan emosi. Untuk itulah teknologi penerjemahan dikembangkan.

Machine Translation Tools dan CAT Tools
Bagi sementara orang, semua program komputer yang dapat digunakan untuk membantu penerjemahan adalah Mesin Penerjemah (Machine Translation Tool). Hal ini tidak benar. Baik di dunia akademis (teori) maupun di dunia industri (praktis), Machine Translation (MT) Tool dan Computer Assisted Translation (CAT) Tool dibedakan dengan jelas.
Saat disebut kata “translation software”, kira-kira apa yang terbayang di benak kebanyakan orang: penerjemah yang bekerja dengan komputernya atau program komputer yang dapat menghasilkan terjemahan saat kita ketikkan teks bahasa sumbernya, seperti Transtool atau Rekso?
Kebanyakan mungkin akan membayangkan yang kedua. Oleh karena itu, tidak mengherankan apabila kita mendengar software penerjemahan, mata kita berbinar-binar karena membayangkan “kerja minimal”. Orang awam yang ingin menerjemahkan juga membayangkan “harga murah”.
Hari ini, mari kita cermati sehingga kita bisa menjelaskan kepada para klien kita bahwa meskipun ada sejuta software penerjemahan, penerjemah tetap diperlukan karena penerjemahan adalah sebuah keterampilan khas manusia.

MT Tool
Perangkat lunak Mesin Penerjemah (Machine Translation Tool) adalah perangkat lunak yang berfungsi untuk mengganti manusia dalam menerjemahkan teks bahasa sumber menjadi teks bahasa sasaran. Campur tangan manusia tidak diperlukan saat proses penerjemahan dilakukan (mungkin sebatas beberapa klik tetikus) karena semua proses telah diprogram sebelumnya. Secara umum, pendekatan yang dipakai di dalam MT tool dapat digambarkan sebagai berikut.

Gambar 1. Pendekatan langsung dan transfer dalam mesin penerjemah.



Di dalam pendekatan penerjemahan langsung, program komputer (MT Tool) tersebut mengenali teks bahasa sasaran, mencocokkan dengan lema di dalam kamus, kemudian langsung menghasilkan teks bahasa sasaran. Dengan pendekatan transfer, program MT akan menganalisis kalimat, kata, frasa, dan lain-lain, baru kemudian mengidentifikasi padanannya di dalam “database”-nya. Setelah itu, barulah teks bahasa sasaran dapat dihasilkan. Dengan pendekatan apa pun, mesinlah yang bekerja.
Contoh MT Tool yang populer di Indonesia adalah Transtool, kemudian Rekso. Sementara itu, silakan kunjungi Google Translate (http://www.google.com/translate_t#). Software yang ada di sana adalah contoh dari MT Tool. Berikut adalah contoh sebuah halaman muka website (www.transbahasa.com) yang diterjemahkan dengan MT tool ini.
Website aslinya adalah sebagai berikut.


Terjemahannya adalah sebagai berikut.


Bagaimana kualitas hasil terjemahannya? Silakan Anda nilai sendiri. Kualitasnya tergantung pada sejauh mana aturan-aturan linguistik dapat dibuat dan dimasukkan di dalam program ini.

Secara umum, MT Tool mempunyai langkah-langkah sebagai berikut:

·   Morphological analysis. Penganalisisan teks sumber secara permukaan, apakah sebuah kata termasuk noun, verb, dll., serta penentuan sub-kategorinya (jamak/tunggal, gender, tense, dll.)
·   Lexical categorisation. Konteks kata dianalisis untuk menentukan makna kata tersebut.
·   Lexical transfer. Proses pemilihan kata bahasa sasaran dari kamusnya.
·   Structural transfer. Proses penyusunan kata ke dalam frasa dengan struktur yang benar, “concordance“, dll.
·   Morphological generation. Penyusunan kalimat bahasa sasaran.

Jadi, bisa dibayangkan seberapa banyak aturan yang harus “diajarkan” oleh programmer untuk dapat membuat MT Tool yang benar-benar memuaskan semua pihak, semua jenis teks dan semua keperluan.
CAT Tools
Selain Machine Translation, kata lain terkait software penerjemahan yang mungkin sering kita dengar adalah Translation Memory (TM). Translation Memory adalah kumpulan hasil terjemahan (bahasa sumber dan bahasa sasaran) yang dapat dibuka dan disalin ke dalam naskah baru. Translation Memory hanyalah salah satu fitur di dalam sebuah peranti yang disebut CAT Tools (Computer Assisted Translation Tools). Agar kita tidak salah memahami, akan kita bahas di sini CAT Tools secara umum.
CAT Tools adalah program komputer yang dapat membantu manusia menerjemahkan. Program ini terdiri dari tiga fitur utama: (a) terminologi management, (b) translation Memory, and (c) quality check. Ketiga fitur ini terintegrasi di dalam satu paket.
Terminology management tool adalah paket dari peranti tersebut yang digunakan untuk membuat, memelihara dan menggunakan glosari. Glosari ini bisa dibuat sambil melakukan penerjemahan, dibuat sebelum menerjemahkan oleh penerjemah, atau sudah disediakan terlebih dahulu oleh klien. Fitur translation memory (memori terjemahan), seperti yang sudah disebutkan di depan, berguna untuk membuat translation memory (TM), memelihara, dan memanfaatkan translation memory.

Translation memory adalah arsip teks dwibahasa yang tersegmentasi, disesuaikan, yang dipecah-pecah dan diklasifikasi, yang dapat disimpan dan dibaca ulang pada berbagai kondisi pencarian. Dengan kata lain, memori terjemahan terdiri dari database (pangkalan data) yang menyimpan segmen teks sumber dan  teks sasaran (sering disebut unit penerjemahan), dan segmen-segmen ini dapat dibaca ulang pada proses penerjemahan yang akan datang. Dengan cara ini memori terjemahan dapat memberi masukan pada penerjemah. Kalau digunakan dengan baik, memori terjemahan dapat meningkatkan konsistensi terjemahan dan kualitasnya. Memori terjemahan ini dapat dipakai bersama-sama oleh beberapa penerjemah. Kerja tim pun dapat menjadi lebih baik dan efisien. Perhatikan bagan di bawah ini.
Gambar 2. Proses menerjemahkan  dengan Translation Memory (CAT Tool)
Dari bagan di atas, dapat dipahami bahwa pada awalnya Penulis menghasilkan naskah bahasa sumber (BSu). Penerjemah menerjemahkan naskah ini dengan bantuan Translation Memory (TM). Setelah Unit Penerjemahan BSu dikenali oleh TM, maka akan ada tiga kemungkinan. Kemungkinan pertama  unit BSu benar-benar baru, jadi tidak ada yang mirip dengan yang di TM. Oleh karena, itu penerjemah harus menerjemahkannya secara konvensional (dan hasilnya akan disimpan di dalam MT). Ini di gambarkan oleh panah ke bawah sebelah kiri. Kemungkinan kedua adalah unit BSu sama persis dengan unit yang ada di dalam TM.  Kondisi ini disebut “exact match”. Maka, sistem CAT Tool langsung memakai data yang tersimpan. Campur tangan penerjemah tidak diperlukan. Lihat panah ke bawah sebelah tangan. Kemungkinan ketiga, unit BSu tidak sama persis dengan sembarang unit di TM, tetapi cukup mirip dengan salah satu atau beberapa unit di dalam TM. Kondisi ini disebut “fuzzy match”. Dalam kondisi ini TM akan menawarkan hasil terjemahan yang telah disimpan di dalam TM dan TM menandai bagian-bagian unit penerjemahan baru yang tidak sama dengan yang telah tersimpan di TM. Kemudian penerjemah dapat menerima, memodifikasi, atau menolak tawaran ini. Lihat panah diagonal dari sudut kanan atas ke kiri bawah.

Yang terakhir, quality check berguna untuk memeriksa kualitas terjemahan yang dihasilkan dari beberapa segi: tanda baca, tag dan konsistensi dengan glosari.
[Catatan: ada juga program terminology management dan quality check yang dijual terpisah.]
Ada berapa macam CAT Tool?
Ditinjau dari antarmuka yang dipakai, ada dua macam: (a) Word-interfaced CAT Tools dan (b) proprietary-interfaced CAT Tools. Jenis pertama menempel pada program MS Word, contohnya Trados, Wordfast, Metatexis. Sedangkan jenis kedua mempunyai antarmuka sendiri. Contoh dari jenis ini adalah Transit, SDLX, dan Deja Vu.
Ditinjau dari jenis teks yang dikerjakan ada (a) text-based CAT Tools dan Binary-based tools. Apabila file yang kita kerjakan terutama mengandung teks, maka jenis pertama sudah tepat. Sebaliknya, jika file yang diterjemahkan mengandung banyak jendela dialog –apalagi yang ada “hotkey”-nya– pilihan pertama kurang efisien, meskipun bisa dilakukan. Beberapa nama CAT Tool dan file yang didukung dapat dilihat di lampiran.
Pertimbangan di dalam memilih CAT Tool

Ada beberapa hal yang dapat dijadikan pertimbangan dalam memilih CAT Tool.
1. Popularitas bagi pemberi kerja
Sampai saat ini, CAT Tool yang paling populer adalah Trados. Hal ini juga diakui oleh CAT Tool lainnya dengan cara mengiklankan diri “dapat mengerjakan format Trados”.
2. Jenis file yang bisa ditangani
Semakin banyak jenis file yang bisa ditangani, semakin fleksibel program tersebut. CAT Tool dengan antarmuka “proprietary” biasanya lebih baik dalam hal ini.
3. Kemudahan pengoperasian (terminology management, translation memory, dan quality check)
Bagi pemula, CAT Tool yang “menempel” pada Word akan lebih mudah karena mereka tidak harus belajar software baru. Namun, bagi pengguna CAT Tool yang sudah berpengalaman, sering kali CAT Tool yang mandiri lebih produktif dan efisien untuk jenis-jenis file “yang tidak umum” jika ditinjau dari hasil akhir.
4. Kompatibilitas dengan CAT Tool lain
Semakin kompatibel sebuah program dengan program lainnya, semakin lapang “arena permainan” yang disediakan karena sering kali penerjemah harus memakai TM (translation memory) atau glosari yang dibuat oleh program lain.
5. Harga
Harga mungkin menjadi pertimbangan. Namun, setelah penerjemah mendapatkan proyek, biasanya harga untuk membeli CAT Tool menjadi pertimbangan yang kesekian. Tidak jarang klien yang memberi lisensi software tersebut.

Naskah apa yang idealnya dikerjakan dengan CAT Tool

Berikut ini adalah ciri-ciri naskah yang sesuai jika dikerjakan dengan CAT Tool:
q      naskah elektronik
q      antarmuka program komputer
q      laman web
q      publisitas, pemasaran, laporan, manual pengoperasian (karena dari tahun ke tahun, ada banyak materi yang sama atau hampir sama)
q      dokumen teknis dalam jumlah besar (karena struktur  isinya kemungkinan banyak diulang).
q      Hasil yang multilingual (dengan pangkalan data yang baik dan dengan Sistem CAT Tool yang baik, satu naskah dapat dikerjakan menjadi beberapa bahasa sekaligus, misalnya dari Bahasa Inggris ke Prancis, Jerman dan Bahasa Indonesia.)
Hasil ini akan menjadi lebih baik apabila ditunjang hal-hal berikut:
q      Pangkalan data terminologi
q      Sumber daya pendukung yang berupa teks-teks lama yang sudah diterjemahkan
q      Petugas sunting pascaproses CAT Tool
q      Penulisan dan penerbitan teknik dengan pertimbangan untuk diterjemahkan (sekarang ada kursus penulisan teknik untuk melatih para insinyur menulis manual agar hasil tulisannya lebih baik dan lebih mudah diolah dengan CAT Tool.
q      Tenaga ahli teknis di bidang kmputer, printer, dll.

Pertimbangan sebelum investasi dalam CAT Tool

Untuk membantu pengambilan Keputusan apakah pembaca akan berinvestasi di bidang sistem CAT Tool, ada beberapa hal yang harus kita pertimbangkan:
1.   Apakah naskah sumber berupa file elektronik atau naskah kertas? Naskah elektronik mudah ditangani dengan CAT  Tool. Kalau naskahnya adalah naskah cetak kertas, tentu dibutuhkan peranti lain untuk mengonversikannya menjadi naskah elektronik. (Kemudian pertimbangkan jenis naskahnya.)
2.      Apakah jenis naskahnya? Kalau jenis naskahnya naskah kreatif, misalnya puisi atau novel, penggunaan MP dan MT tidak dianjurkan, apalagi kalau naskah sumbernya berupa cetak kertas. Kalau naskah itu naskah teknik yang banyak mengandung pengulangan dan diperlukan konsistensi padanan kata, CAT Tool tentu sangat membantu.
  1. Apa jenis terjemahan berdasar tujuannya, inbound atau outbound translation? Inbound translation artinya penerjemahan yang dilakukan dengan tujuan untuk memahami teks asli. Teks terjemahan hanya digunakan untuk membantu memahami teks sumber. Untuk keperluan ini Mesin Penerjemah sudah memadai. Tetapi apabila naskah terjemahannya akan digunakan untuk mengkomunikasikan isi teks kepada sidang pembaca lain bahasa, suntingan oleh manusia sangat diperlukan. Sistem CAT Tool mungkin dapat meningkatkan kecepatan penerjemahan.

Beberapa konsep utama terkait CAT Tool
Ada beberapa konsep yang harus dikenali saat kita bekerja memakai CAT Tool. (Konsep-konsep ini akan semakin jelas pada sesi praktik.) Apabila seorang penerjemah sudah memahami konsep ini dengan baik, maka dia akan siap mengoperasikan segala jenis CAT Tool. Beberapa dari konsep-konsep tersebut adalah sebagai berikut:

          terminologi management (lihat atas)
          translation memory (lihat atas)
          quality check (lihat atas)
          interactive mode
Di dalam interactive mode, setiap kali penerjemah pindah ke unit penerjemahan baru, program Translation Memory Program akan mencari segmen yang identik dari kumpulan terjemahannya. Kalau sama persis, segmen terjemahan itu akan langsung disalinkan di naskah baru. Jika mirip, akan diberitahu kemiripannya. Dengan demikian, penerjemah dengan cepat dapat memutuskan langkahnya. Jadi, ini adalah kerja manusia, bukan kerja komputer.
          automatic mode
Di dalam mode otomatis, program secara otomatis menyisipkan teks dari memori ke dalam teks bahasa sasaran. Kondisi penyisipan dapat di atar apakah yang “exact match” saja atau termasuk “fuzzy match” dengan batas tertentu, atau bahkan ditambahi “assemble” juga.
          exact match: kondisi kemiripan dimana teks baru sama persis dengan teks lama
          fuzzy match: kondisi kemiripan dimana teks baru dengan teks lama kurang hampir sama, tetapi kemiripannya tidak 100%
          reference materials: teks lama yang terdiri dari unit bahasa sumber dan bahasa sasaran yang sudah dipasang-pasangkan, disebut juga translation memory atau TM
          tag: kode di dalam komputer yang mengatur tampilan teks atau gambar di monitor atau hasil cetak

Penutup
Sebagai penutup, dapat disimpulkan bahwa teknologi penerjemahan tidak akan dapat menggantikan penerjemah. Tetapi penerjemah juga tidak bisa berjauhan dengan teknologi penerjemahan karena teknologi penerjemahan memang diciptakan untuk membantu penerjemah menyelesaikan tugas-tugasnya sesuai dengan tuntutan zaman.

7 komentar di “>Teknologi Penerjemahan: Machine Translation dan Translation Memory

  1. >Mbak winta, Pak Tarto emang sukanya bercanda. Kalau jumpa darat dan kenal secara fisik sih belum, Mbak. Tapi, kalau soal kenal reputasi, tentu saya sangat kenal reputasi beliau sebagai sesepuh penerjemah di Malang dan tokoh Bahtera. 🙂

  2. AssWrWb, Pak WIT, untuk saya yang masih baru akan memulai sebagai penterjemah, apakah sudah diperbolehkan untuk mengunduh CAT TOOLS walaupun masih belum mendapatkan proyek terjemahan ? Mana yang lebih sulit dan lebih lama untuk dipelajari, CAT TOOLS atau TRADOS 7 ? Mohon penjelasannya, terima kasih

    Wassalamu’alaikum WrWb
    KARTIN MILADIYAH

Tinggalkan Balasan ke KARTIN MILADIYAH Batalkan balasan