Machine Translation را انتخاب کنیم؟
برای انتخاب Machine Translation فرض کنید کسبوکاری هستید که تصمیم گرفتهاید در سیستم Machine Translation سرمایهگذاری کنید. شما تحقیقات اولیهای انجام دادهاید و متوجه شدهاید که گزینههای زیادی برای انتخاب وجود دارد. هر کدام ادعا میکنند که بر اساس معیارهای خاصی به مقدار مشخصی امتیاز می دهند، اما شما نمی دانید این اعداد واقعاً به چه معنا هستند. چگونه می دانید کدام یک برای شما مناسب تر است؟
شما باید بدانید که ارزیابی Machine Translation چگونه کار می کند.
ارزیابی چیست؟
این روشی برای امتیاز دادن به کیفیت Machine Translation است. به طوری که میزان خوبی سیستم را مشخص میکند. مبنای محکمی برای مقایسه میزان موثر بودن سیستمهای این برنامه وجود دارد. برای انجام این کار، ارزیابی این هوش مصنوعی از معیارهای قابل سنجش استفاده می کند.
رویکردها نسبت به ارزیابی این برنامه
رویکردهای ارزیابی ابن برنامه مبتنی بر مفهوم ریزه کاری است. یعنی سطوح مختلفی که ممکن است امتیازدهی قابل توجه در نظر گرفته شود.
رویکرد مبتنی بر جمله: بر اساس این رویکرد، هر جمله نمره ای میگیرد که می گوید آیا ترجمه آن خوب (1) است یا نه(0) و برای کل یک میانگین میگیرد. این بیشتر در ارزیابی انسان انجام میشود.
رویکرد مبتنی بر سند: همچنین به عنوان رویکرد مبتنی بر پیکره شناخته می شود. به جملات نیز امتیاز میدهد، اما نمره قابل توجه کل یا میانگین در میان مجموعه بزرگتری از اسناد است. این کوچکترین سطحی است که در آن ارزیابی خودکار این برنامه را می توان مهم در نظر گرفت، زیرا به شدت به آمار یک مجموعه گسترده بستگی دارد.
رویکرد مبتنی بر زمینه: این رویکرد با رویکردهای قبلی متفاوت است زیرا آنچه در نظر میگیرد این است که تکلیف MT تا چه اندازه با اهدافی که برای آن در نظر گرفتند مطابقت دارد، نه از طریق میانگین نمرات بر اساس جملات. به این ترتیب، ممکن است یک رویکرد کل نگر برای ارزیابی Machine Translation در نظر گرفته شود.