लैंगप्रिज़्म - क्राउडसोर्सिंग वेब कंटेंट ट्रांसलेशन सर्विस


नमस्कार, प्रिय प्रभामंडल!

मैं आपको हमारे LangPrism इंटरनेट अनुवाद परियोजना से परिचित कराना चाहता हूं। क्राउडसोर्सिंग ने लंबे और आत्मविश्वास से मानव गतिविधि के सभी क्षेत्रों में प्रवेश किया है और अनुवाद के रूप में ऐसे क्षेत्र के लिए क्राउडसोर्सिंग का उपयोग कुछ विशेष रूप से नया नहीं है, हालांकि हमने इसे थोड़ा अलग कोण से देखने का फैसला किया और आपको हमारी परियोजना के रूप में अपना दृष्टिकोण प्रस्तुत करना चाहते हैं। । शायद कई लोग हमारे अनुवादों से यहां पहले से ही हैबर ( अनुवाद , अनुवाद , एक और अनुवाद ) से परिचित हैं, लेकिन, फिर भी, मैंने इसके बारे में अधिक विस्तार से बात करने के लिए एक अलग पोस्ट प्रकाशित करने का फैसला किया।

कटौती के तहत आप जापानी में नई हैबे के बारे में भी सीखेंगे, याद मत करो!


Praeteritum


लगभग दो साल पहले, Microsoft ने अपने समुदाय के बीच एक ITBonus वफादारी कार्यक्रम चलाया, जिसमें उसने Microsoft उत्पादों से संबंधित विभिन्न गतिविधियों को प्रोत्साहित किया। उनमें Microsoft तकनीकों पर तकनीकी लेखों और ब्लॉगों का अनुवाद था। फिर मैंने इस कार्यक्रम में सक्रिय रूप से भाग लिया और यहां तक ​​कि कई बार मैं रैंकिंग में पहले स्थान पर था। हालाँकि, शुरू से ही, मैं अपने अनुवाद को साझा करने में असमर्थता से बहुत परेशान था। मेल द्वारा आयोजकों को अनुवाद के साथ html-file भेजने के अलावा कोई और रास्ता नहीं था। यह उल्लेख करने के लिए नहीं कि आपको क्रोम में डेवलपर टूल का उपयोग करके अनुवाद को मैन्युअल रूप से संपादित करना था।
तब यह विचार सामने आया, और ऐसी सेवा क्यों नहीं की गई, जो अनुवादक को वेब पेज के संदर्भ में अपनी सामग्री को सीधे बदलने की अनुमति दे, और अन्य उपयोगकर्ता इस पहले से अनुवादित सामग्री को देखने के लिए। इस विचार को थोड़ा विकसित करने के बाद, यह स्पष्ट हो गया कि यह विकिपीडिया अवधारणा के समान है।

बड़ा विचार


हमारा बड़ा विचार विकिपीडिया और Google अनुवाद के विचार को मिलाना है। शाब्दिक रूप से, आप एक विदेशी भाषा में एक वेबसाइट पर जाते हैं, लैंगप्रिज़्म का उपयोग करते हैं, और यदि आपके पास विकिपीडिया पर एक विश्वकोश लेख लिखने का अवसर है, तो लैंगप्रिज़्म आपको वेब पेज को किसी अन्य भाषा में अनुवाद करके योगदान करने की अनुमति देता है। उसी समय, आपका अनुवाद तुरंत अन्य उपयोगकर्ताओं के लिए उपलब्ध हो जाता है, जो उन्हें अपनी मूल भाषा में विदेशी वेब प्रकाशन पढ़ने की अनुमति देता है।



यह सब ब्राउज़र में स्थापित लैंगप्रिज्म एक्सटेंशन के कारण काम करता है, जो सभी आधुनिक ब्राउज़रों के लिए मौजूद है: क्रोम के लिए देशी एक्सटेंशन और अन्य ब्राउज़रों के लिए बुकमार्कलेट के रूप में एक्सटेंशन। आप विस्तार सक्रिय करते हैं, निम्नलिखित होता है:


एक बार जब किसी वाक्य को किसी वेबसाइट पर अनुवादित किया जाता है, तो वह अनुवाद मेमोरी सिस्टम में रहता है और आगे के अनुरोधों पर वहां से प्राप्त किया जा सकता है। इस प्रकार, कुछ समय बाद, सिस्टम स्वयं एक वैश्विक अनुवाद स्मृति की भूमिका निभाएगा, जिसका उपयोग न केवल वेब सामग्री के अनुवाद के लिए किया जा सकता है, बल्कि अन्य क्षेत्रों में भी किया जा सकता है, उदाहरण के लिए, जब तकनीकी ग्रंथों, निर्देशों आदि का अनुवाद किया जाता है।

Praesens


अब क्रोम के लिए लगभग 1,400 लोग LangPrism एक्सटेंशन का उपयोग करते हैं, पंजीकृत उपयोगकर्ताओं की संख्या लगभग 420 है। अनाम उपयोगकर्ता भी अनुवाद में एक महत्वपूर्ण योगदान देते हैं, प्रति माह 100,000 शब्दों का अनुवाद करते हैं। समुदाय खुद अपनी प्राथमिकताओं के आधार पर अनुवाद के लिए साइटों का चयन करता है, डोमेन द्वारा अनुवादित सामग्री की मात्रा का वितरण अब इस तरह दिखता है:



कुल मिलाकर, परियोजना के जीवनकाल में 400,000 से अधिक शब्दों का अनुवाद किया गया है, जो युद्ध और शांति के दो ग्रंथों या पांच ठोस 300 पेज की किताबों की मात्रा के बराबर है। यह बहुत अच्छा है यह देखते हुए कि एक पुस्तक के लिए लेखन चक्र लगभग 1 वर्ष है। हमारे समुदाय में सबसे लोकप्रिय साइटों में से एक TechCrunch है।



आज, सिस्टम में मध्यस्थों की भूमिका उपयोगकर्ताओं द्वारा स्वयं की जाती है और स्पैम से निपटने के लिए सबसे सरल तंत्र है। विकिपीडिया के साथ समानता से, हमने अनुवाद जोड़ने के लिए एक पोस्ट-मॉडेरेटेड मॉडल बनाया, ताकि आपका कोई भी अनुवाद तुरंत अन्य उपयोगकर्ताओं के लिए उपलब्ध हो जाए। अब, हमारे काम की दिशाओं में से एक अनुवाद में अर्थ की विकृति का मुकाबला करने के लिए एक बुद्धिमान तकनीक का विकास है, जो क्राउडसोर्सिंग अनुवाद प्रक्रिया की गुणवत्ता को अधिक सटीक रूप से नियंत्रित करेगा।



हाल ही में, सेवा पर ट्रांसफ़र अनुभाग दिखाई दिया, जिसमें इंटरनेट पर पाए जाने वाले सबसे लोकप्रिय विदेशी लेख शामिल हैं। यह अनुवादकों को प्रासंगिक लेखों का अनुवाद करने और अन्य लोगों को नेटवर्क पर दिखाई देने वाली सभी सबसे दिलचस्प चीजों के बराबर रखने का अवसर प्रदान करता है। इस खंड को स्वयं दिलचस्प सामग्री के लोकप्रिय एकत्रीकरण सेवाओं की तरह बनाया गया है। रूसी में StumbleUpon एक प्रकार का। UX, Chipsadesign विकसित करने में मदद के लिए धन्यवाद।



वेब पृष्ठों पर सभी दृश्यमान अनुवाद कार्यों का दूसरा पहलू लैंगप्रिज्म समुदाय पोर्टल है । यह अनुवादकों के लिए एक प्रकार का सोशल नेटवर्क है, जो उन्हें संयुक्त अनुवाद में बातचीत के मुद्दों को हल करने, शब्दावली का संकलन करने और अनुवाद की शैली पर सहमत होने की अनुमति देता है। हर अनुवादक अपने प्रोफ़ाइल समुदाय पर एक पोर्टल है। पोर्टल एक लाइव फीड प्रदान करता है जो उपयोगकर्ताओं द्वारा जोड़े गए नवीनतम अनुवादों को दिखाता है, और अनुवादित शब्दों की संख्या द्वारा एकत्र किए गए सामुदायिक उपयोगकर्ताओं की एक अजीब रेटिंग है।

रूसी में हैरी पॉटर




अब अनुवादकों के लिए सबसे सक्रिय क्षेत्रों में से एक पॉटरमोर की हैरी पॉटर पुस्तकों पर आधारित खेल का अनुवाद कर रहा है। ब्राउज़र गेम्स लैंगप्रिज़्म का उपयोग करने के लिए एक महान जगह बन गए, क्योंकि आधिकारिक अनुवाद न होने पर उन पर स्थानीयकृत सामग्री को "खींचने" का कोई और तरीका नहीं है। पोटरमोर फ्लैश का उपयोग करता है, लेकिन मुख्य पाठ html में लिखा जाता है, जिससे अनुवाद करना आसान हो जाता है। अनुवादक पोट्टरमोर अनुवाद करते थे, केवल विशेष मंचों में अनुवाद पोस्ट करते थे, या VKontakte समूहों में। इसका उपयोग करने के लिए, मुझे दो ब्राउज़र विंडो खोलनी थी और कुछ समझने के लिए अनुवाद के साथ स्रोत पाठ की तुलना करनी थी। अब हम स्वयं अनुवादकों से प्रसन्न हैं, जिनके पास अनुवाद के लिए एक सुविधाजनक उपकरण है, साथ ही साधारण खिलाड़ी भी हैं, जो इस घटना को जादू से ज्यादा कुछ नहीं कहते हैं। लैंगप्रिज़्म उपयोगकर्ताओं ने पोटरमोर को पूरी तरह से रूसी में अनुवाद करने के लिए तीन हफ्तों में प्रबंधित किया, जिसमें 80,000 से अधिक अनुवादित शब्द हैं।

जापानी में Habr




इतना समय पहले नहीं, जापान के अनुवादक सेवा में रुचि रखते थे। अचानक, वे हेबर का जापानी में अनुवाद करने लगे। आप अभी यापनोखब्र का उपयोग करने का प्रयास कर सकते हैं। यदि यह प्रवृत्ति जारी रहती है, तो हमारे पास जल्द ही जापानी मूल निवासियों के लिए उनकी मूल भाषा में प्रसारण करने का मौका है! Taishiro , योगदान देने के लिए Yukihiro धन्यवाद!

Futura


इंटरनेट पर बहुभाषी सूचनाओं के आदान-प्रदान के लिए लैंगप्रिज्म को एक अद्वितीय मानक बनाने के लिए भविष्य की योजनाएं हैं, क्योंकि अब विभिन्न भाषाओं में महत्वपूर्ण और उपयोगी जानकारी बनाई गई है, जो हर बार नए सिरे से उत्पन्न करने के लिए समझ में नहीं आती है। यह केवल विभिन्न भाषाओं के बीच सूचनात्मक, सांस्कृतिक पुलों का निर्माण करने के लिए पर्याप्त है और दुनिया भर में जमा हुए कुल मूल्य सभी के लिए उपलब्ध हो जाएंगे। जैसा कि विकिपीडिया ने एक बार एक उपकरण प्रदान किया था जो मानवता के पास सभी ज्ञान का एक हिस्सा बनाने के लिए संभव बनाता है, इसलिए हम इसे और कई अन्य जानकारी इंटरनेट पर प्रत्येक उपयोगकर्ता को लाने का अवसर देना चाहते हैं।

मैं इस परियोजना में भाग लेने के लिए सभी हाइब्रिडरों को आमंत्रित करना चाहता हूं, और अगर हर कोई जो इस लेख को पढ़ता है, वह कम से कम एक अनुवाद करता है, अपने विचार या अन्य मदद साझा करता है, हम इस सही मायने में महान लक्ष्य के करीब एक और कदम उठाएंगे।
में आपका स्वागत है LangPrism

Source: https://habr.com/ru/post/In169305/


All Articles