Get Mystery Box with random crypto!

بعد از حدود چهار سال کار، پیکره فارسی گفتاری (محاوره ای) هم با | زبانشناسی بوعلی سینا

بعد از حدود چهار سال کار، پیکره فارسی گفتاری (محاوره ای) هم بام (مخفف همدان و بامبرگ) به صورت کامل در دسترس قرار گرفت. این پیکره حاصل پروژه مشترکی بین دکتر محمد راسخ مهند (استاد دانشگاه بوعلی سینا) و دکتر جفری هیگ (استاد دانشگاه بامبرگ) است. تیمی از دانشجویان در این دو دانشگاه در انجام این کار مشارکت داشتند. این پیکره از چند جهت خاص است.
نخست اینکه پیکره ای است که از گفتار کاملا طبیعی سخنگویان زبان فارسی فراهم شده است.
دوم اینکه طبق معیارهای مستندسازی زبان و بخصوص با توجه به موازین رده شناسی پیکره ای گرد آمده و برچسب گذاری شده است. از این حیث به محققان در سراسر جهان اجازه می دهد داده های زبان فارسی را نیز بررسی کنند و محدودیتهای خط فارسی مانع کار نیست.
سوم اینکه این پیکره به صورت فایلهای متفاوت (متنی و صوتی) در دسترس است و از این حیث نیز منحصر بفرد است.
چهارم اینکه اکنون پیکره زبان فارسی با پیکره زبانهای دیگر در multi-cast قابل مقایسه است زیرا طبق استاندارد جهانی تدوین شده است. و ویژگی نهایی اینکه این پیکره بدون هیچ محدودیتی در اختیار همگان قرار دارد.

(متن از صفحه اینستاگرام دکتر محمد راسخ مهند)