सांख्यिकीय मशीनी अनुवाद

सांख्यिकीय मशीनी अनुवाद (Statistical machine translation (SMT)) मशीनी अनुवाद का ऐसा अल्गोरिद्म है जो दोनो भाषाओं के द्विभाषी शब्दराशि (टेक्स्ट कॉर्पस) के अध्ययन से निर्मित सांख्यिकीय मॉडल पर निर्भर करता है। यह विधि नियम पर आधारित मशीनी अनुवाद (rule-based machine translation) तथा उदाहरण पर आधारित मशीनी अनुवाद (example-based machine translation) से बिलकुल अलग है। विश्व प्रसिद्ध गूगल अनुवादक इसी सिद्धान्त के प्रयोग से अनुवाद करता है।

इतिहास

सांख्यिकीय मशीनी अनुवाद का सर्वप्रथम विचार वारेन वीवर (Warren Weaver) ने सन १९४९ में दिया था। सांख्यिकीय मशीनी अनुवाद बहुत दिनो बाद पुनः सन १९९१ में शोधकर्ताओं ने पेश किया। इसके बाद सांख्यिकीय मशीनी अनुवाद पुनः मुख्यधारा में आ गया। आज (सन २००८) में यह सर्वाधिक अध्ययन किया जाने वाला अनुवाद का तरीका बन गया है।

लाभ

  • संसाधनों का बेहतर उपयोग
    • प्राकृतिक भाषाओं का बहुत सी सामग्री मशीन द्वारा पढे जाने योग्य प्रारूप में विद्यमान है।
    • प्रायः, सांख्यिकीय मशीनी अनुवाद (SMT) किसी विशेष भाषा-युग्म के लिये नहीं बनाये जाते। अतः किसी भी भाषा-युग्म के लिये काम करेगा।
    • नियम-पर आधारित मशीनी अनुवाद के लिये मानव-श्रम लगाकर भाषायी नियम बनाने पड़ते हैं। यह एक महंगा कार्य हो सकता है; साथ ही हर भाषा के लिये अलग से मेहनत करनी पड़ती है।
  • सांख्यिकीय मशीनी अनुवाद अपेक्षाकृत अधिक स्वाभाविक अनुवाद पैदा करता है।

इन्हें भी देखें

बाहरी कड़ियाँ