ساختار اطلاعاتی ققنوس از اساس چندزبانه است. به این معنی که هر قلم اطلاعاتی در آن واحد میتواند به بیش از یک زبان در سیستم ثبت شود. اما وجود ساختار چندزبانه برای اطلاعات به این معنی نیست که تمام اقلام اطلاعاتی به تمام زبانها در سیستم ثبت میشوند. بسته به میزان مخاطب یک زبان خاص، ممکن است تمام یا بخشی از اطلاعات به آن زبان تولید شود. معنی دیگر این امر آنست که ممکن است در یک مقطع خاص از زمان بخشی از اطلاعات موجود در سیستم برای مخاطبان یک زبان مشخص قابل استفاده نباشد.
اطلاعات پایگاه داده هدیه ققنوس از منابع خارجی تامین شده و از این رو زبان "اولیه" آن انگلیسی است. این در حالی است که زبان فارسی زبان مورد ترجیح بیشتر کاربران آن است. پس این دسته از کاربران بایستی تا زمان "فارسیسازی" اطلاعات موجود یا ثبت رکوردهای جدید به زبان فارسی منتظر میماندند. اما فعالیت ثبت این اطلاعات پیشه کارشناسان علم اطلاعات و با دانش فنی و توانایی خاص خود است. کارشناسانی که پتانسیل اطلاعاتی موجود در این مستندات را درک کرده، فاصله غنای اطلاعاتی آن با خلاء اطلاعاتی موجود در حوزه زبان فارسی را تشخیص داده و به استفاده از این اطلاعات برای پر کردن این فاصله اهتمام ورزند.
در بهینهترین شکل خود هم، این درک و تشخیص و اهتمام امری زمانبر است. ما در تیم ققنوس بر آن شدیم که تا آن زمان، فنآوریهای موجود در زیرساخت ققنوس را در اختیار کاربران هدیه ققنوس قرار دهیم تا بتوانند از وضعیت موجود اطلاعات هم بهره لازم را ببرند. یکی از این فنآوریها ابزار ترجمه است که از نسخه 1.6 در اختیار کاربران هدیه ققنوس قرار میگیرد.
آنچه که در محاوره به سادگی ترجمه خوانده میشود، در حوزه تخصصی زبان مجموعه فعالیتهایی چون ترجمه، آوانویسی، نویسهگردانی و امثال آن را در بر میگیرد. تعریف تخصصی هر یک از این فعالیتها و شرح تفاوتهای آنها در حوصله این نوشته نیست. اما از انجام تمام این فعالیتها نهایتا یک نتیجه واحد حاصل میشود و آن ارائه واژه یا عبارت "همارز" برای یک واژه یا عبارت اولیه در یک زبان/الفبای دیگر است. ابزار ترجمه ققنوس با تکیه بر روشهای مختلف چنین واژههای همارزی را برای واژههای مورد نظر شما ارائه میکند.
ابزار ترجمه ابزاری عمومی در برنامه است که میتواند برای ترجمه تقریبا تمام محتویاتی که از طریق برنامه ارائه میشود به کار رود. تکمهای در بخش بالایی صفحه اصلی برنامه برای فعالسازی این ابزار پیشبینی شده است.
این تکمه پس از اتصال شما به هدیه ققنوس فعال میشود و با فشردن آن، ابزار ترجمه در یک پنجره شناور بر روی صفحه اصلی برنامه ظاهر خواهد شد.
استفاده از ابزار ترجمه بسیار ساده است. کافی است عبارت مورد نظر خود را در جعبه بالای پنجره وارد کرده و تکمه + را بزنید. عبارتهایی همارز عبارت مورد نظر خود را از هر منبعی که در پایین علامتگذاری کرده باشید دریافت خواهید کرد. به عنوان مثال در پایین نتایج حاصل از ترجمه عبارت contemporary را ملاحظه میکنید.
عبارتهای ظاهر شده از هر دستهای که باشند به صورت پیوندهایی ظاهر میشوند که علاوه بر مطالعه میتوانند کلیک نیز شوند. کلیک بر روی هر یک از این واژهها به معنی ترجمه آن واژه، یعنی معادل با انتقال آن به جعبه بالایی و فشردن کلید + است. بنابراین امر ترجمه یک واژه میتواند با ترجمه عبارتهای ظاهر شده بعدی تا حصول نتیجه ادامه یابد. بدیهی است تلاشی برای یافتن عبارت همارز از گزینههایی که علامتگذاری نکرده باشید صورت نخواهد گرفت.
در کنار تکمه + تکمه دیگری (*) نیز وجود دارد که فشردن آن ویژگی دیگری از ابزار ترجمه را فعال میکند. در این وضعیت، ابزار ترجمه اشارهگر ماوس شما را دنبال کرده و واژه مورد اشاره آن را برای ترجمه به شما پیشنهاد خواهد داد. در صورتی که مایل به ترجمه آن واژه باشید، تنها کافی است با نگه داشتن کلید Ctrl بر روی آن واژه کلیک کنید. با استفاده از این امکان از تایپ کردن کلمات در جعبه بالایی معاف خواهید شد و میتوانید از این ابزار در حین خواندن متنهای طولانیتر، مانند یادداشت اثر، به سهولت استفاده کنید. اشارهگر ماوس تقریبا در هر کجا از پنجرههای برنامه دنبال میشود و میتواند هر محتوایی که در پنجرههای مختلف برنامه ققنوس ظاهر شده باشد را به ابزار ترجمه منتقل نماید. در شکل زیر از این امکان برای ترجمه متن یادداشت یک اثر بهره گرفته شده است.
واژهنامه
در پنجره ابزار ترجمه اولین گزینه از میان سه گزینه موجود (فعلی)، گزینه واژهنامه است. به طور سنتی، واژهنامه فهرستی ثابت از واژگان به همراه واژههای همارز آن در همان زبان یا یک زبان دیگر است. به لطف فنآوری، واژهنامههای امروزی میتوانند پویا باشند و با استفاده از روشهای مختلف فهرست واژگان و عبارتهای خود را بهروز کنند. واژهنامه مورد استفاده ققنوس هم چنین واژهنامهای است.
فهرست واژگان و عبارتهای معادل به طور پیوسته توسط کاربران (دیگر سیستمها) در حال تکمیل و اصلاح هستند. به علاوه، این واژهنامه از روشی که به روش مقابله مشهور است هم بهره میبرد. در این روش واژهها و عبارتهای همارز از مقابله دو متن، که از پیش میدانیم ترجمه یکدیگر هستند، استخراج میشوند. بدیهی است شما، به عنوان کاربر هدیه ققنوس، درگیر پیچیدگیهای این امور پسزمینهای نخواهید بود. شما تنها شاهد افزایش تدریجی کیفیت پاسخها در طول زمان خواهید بود.
واژهنامه چندزبانه است. اما از آنجاکه مخاطب عمده هدیه ققنوس فارسیزبان فرض شده است، واژهنامه ارائه شده در هدیه ققنوس، همانطور که در عنوان آن هم تصریح شده، برای ترجمه به زبان فارسی تنظیم شده است. با این وجود واژهنامه میتواند واژهها و عبارات را از چندین زبان مختلف به زبان فارسی ترجمه کند. زبان عبارت یا واژه وارد شده به طور خودکار تشخیص داده شده و معادل فارسی آن ارائه میشود. پس از نمایان شدن واژه همارز میتوانید با نگاه داشتن ماوس بر روی آن واژه زبان تشخیصی سیستم را ملاحظه نمایید.
تحلیل معنایی
در هر زبان، بسیاری از واژهها در بیش از یک معنا بهکار میروند. به عنوان مثال واژه آشنای check در زبان انگلیسی در 38 معنای متفاوت به کار میرود. خواننده متن تنها با داشتن شناخت از کاربردهای معنایی واژهها (word senses) است که میتواند مفهوم یک متن را درک نماید. گزینه تحلیل معنایی، کاربردهای معنایی مختلف هر واژه را به تفکیک بازتاب میدهد. فهرستی از کاربردهای معنایی شناخته شده برای هر واژه ورودی فهرست میشود. در مورد هر کاربرد اطلاعاتی جانبی ارائه میشود تا معنای مورد نظر در آن کاربرد درک شود.
این اطلاعات تکمیلی بسته به نوع واژه متفاوت و از انواع زیر هستند:
• تعریف توصیفی از معنا
• مثالهایی از کاربرد معنا
• مبحث معنا
• مفاهیم عامتر و خاصتر آن
• مفهوم یک مصداق یا مصادیق یک مفهوم
همانطور که یک واژه میتواند حامل معانی متفاوتی باشد. یک معنای واحد هم میتواند توسط واژههای مختلفی بیان شود. برای هر کاربرد معنایی این واژههای مترادف به صورت پیوند و در یک سطر بازنمایی میشوند.
زبانهای مختلف، واژگان متفاوتی را برای یک معنای واحد مورد استفاده قرار میدهند. در صورتی که برای یک کاربرد معنایی، واژگانی از یک زبان دیگر وجود داشته باشد، کاربرد معنایی معادلی برای کاربرد اصلی فرض شده و در ذیل سطر مربوط به آن به دنبال علامت = ظاهر میشود. همینطور در صورتی که کاربرد معنایی دیگری یافت شود که با کاربرد اولیه یکسان نبوده اما نزدیک به آن ارزیابی شود نیز در ذیل آن و به دنبال علامت ≈ نمایش داده میشود.
با در نظر گرفتن زبان فعلی اطلاعات هدیه ققنوس و زبان مورد استفاده کاربر، زبانهای فارسی و انگلیسی در بخش تحلیل معنایی فعال و قابل استفاده هستند.
موقعیتهای جغرافیایی
گاهی در میان متون و نوشتهها ارجاعاتی به موقعیتها و مکانهای جغرافیایی وجود دارد. عنوان مکانها اسامی خاص هستند که مانند دیگر اسامی خاص، نه ترجمه، بلکه بازنویسی آوایی و یا نویسهگردانی میشوند. روشهای متفاوتی که برای ثبت آواها مورد استفاده قرار میگیرد، ممکن است باعث گمراهی خواننده شود. مثلا عنوان شهر تهران با الفبای لاتین و در کشورهای انگلیسی زبان عمدتا به صورت Tehran ثبت میشود. اما فرانسوی زبانها این عنوان را با همان مجموعه الفبایی ولی به شکل Teheran ثبت میکنند. اطلاق عناوین متعدد به یک مکان واحد هم موضوع دیگری است. مثلا ما کشوری که در زبان انگلیسی Germany نوشته میشود را آلمان مینامیم. آوانویسی یا نویسهگردانی نمیتواند این دو نام را با یکدیگر تطبیق دهد. تغییر عنوان یک مکان در طول تاریخ هم عامل دیگری است. مثلا اصفهان زمانی اسپادانا خوانده میشده است. تمام این عوامل ممکن است باعث شود که در هنگام مطالعه یک متن تشخیص موقعیت جغرافیایی واقعی یک مکان با اشکال مواجه شود. با استفاده از گزینه موقعیتهای جغرافیایی میتوان تمامی این اشکال مختلف نوشتاری نام مکانها را با یکدیگر مطابقت داد.
علاوه بر تطبیق با نام مکانها، سیستم میتواند عبارت ورودی را با نام مکانهای مرتبط نیز تطبیق دهد. مثلا ممکن است در ازاء عبارت ورودی Tehran، با عناوین ورامین یا قرچک در خروجی مواجه شوید. این دسته از مکانها که به واسطه ارتباط جغرافیایی در نتیجه ظاهر میشوند با اولویت پایینتری نسبت به تطبیقهای دقیقتر دسته اول و در زیر آنها ظاهر خواهند شد.
همچنین سیستم قادر به نوعی تطبیق غیردقیق (fuzzy) بر اساس تشابه آوایی/نوشتاری عبارت ورودی با نام مکانها نیز هست. گاهی نویسنده یک متن تنها به صورت شفاهی با عنوان یک مکان مواجه شده و آوای مربوطه را ثبت میکند. شکل نوشتاری مورد استفاده میتواند با تمام اشکال رسمی ثبت آن نام تفاوت فاحش داشته اما از نظر آوایی با آن همخوان باشد. مثلا Choghazanbil، Cheqazinbil، Chogha-Zanbil نمونههایی از ثبت نام نیایشگاه چغازنبیل است. این اشکال از نظر نوشتاری بسیار متفاوت ولی از نظر آوایی مشابه هستند. سیستم میتواند با تطبیق آوایی تمامی این اشکال نوشتاری را با مکان اصلی، که به هیچیک از این اشکال ثبت نشده، مطابقت دهد. این دست از تطبیقها در صورتی که تطبیقهای دقیقتر بالایی قابل انجام نباشد انجام شده و با اولویت کمتر در زیر آنها نمایش داده میشود.
طول و عرض جغرافیایی، دیگر عنوانهای اطلاقی به آن و همینطور شیوه تطبیق آن با عبارت ورودی در کنار هر یک از مکانهای تطبیق یافته با عبارت ورودی نمایش داده میشود.