مقاله مروری بر سیستم تشخیص گفتار و کاربرد آن

تحقیق و پروژه و پایان نامه و مقاله دانشجویی

عنوان :

مقاله مروری بر سیستم تشخیص گفتار و کاربرد آن

تعداد صفحات : ۲۳

نوع فایل : ورد و قابل ویرایش

چکیده:

استفاده از گفتار به عنوان درونداد اطلاعاتی علاوه بر سرعت،در نحوه تعامل انسان بر محیط تاثیر بسزایی داشته است. با وجودیکه در حال حاضر سیستم های زیادی برای تشخیص گفتار وجود دارد ولی همه این دستاوردها به گونه ای، دسته ای از محدودیت های ساده کننده را یدک می کشند که حذف این محدودیت ها می تواند به صورت قابل ملاحظه ای بر پیچیدگی این سیستم ها بیفزاید.

یکی از اهداف انسانها در تولید چنین سیستم هایی مسلماً توجه به این نکته بوده است که “ورود اطلاعات به صورت صوتی ،اجرای دستورات علاوه بر صرفه جویی در وقت و هزینه ،به طرق مختلف کیفیت زندگی ما را افزایش می دهند. در این مقاله پس از معرفی و ذکر تاریخچه‌ای ازفناوری سیستم ها تشخیص گفتار، دو نوع تقسیم بندی از سیستمها ارائه می شود، و سپس به برخی ضعف ها و نهایتاً کاربرد این فناوری اشاره می شود.

کلمات کلیدی : سیستمهای تشخیص گفتار، فناوری اطلاعات، بازشناسی گفتار، کتابخانه،

فهرست مطالب

چکیده:    ۱
۱٫ مقدمه    ۲
۲٫تعریف      ۲
۳٫تاریخچه فناوری تشخیص گفتار    ۳
۴٫عملکرد سیستم های تشخیص گفتار    ۴
۱٫۴ تبدیل گفتاربه داده    ۵
۲٫۴ تشخیص گفتار با استفاده از مدل(الگوریتم)آماری    ۶
۵٫سیستم های تشخیص گفتار:تقسیم بندی بر اساس عملکرد    ۷
۱٫۵ تعداد گویندگان    ۷
۲٫۵ شیوه صحبت کردن    ۸
۳٫۵ اندازه بانک واژگان    ۸
۶٫سیستم های تشخیص گفتار:تقسیم بندی بر اساس برونداد    ۹
۱٫۶ گفتار به متن Speech To Text    ۹
۲٫۶ گفتار به گفتار Speech To Speech    ۱۱
۳٫۶ گفتار به دستور  Speech To Command    ۱۳
۷٫کاربرد فناوری تشخیص گفتار در کتابخانه    ۱۴
۸٫سیستم های تشخیص گفتار:ضعف ها و محدودیت ها    ۱۵
۱٫۸ ورود سرو صدای محیط(Noise)    ۱۵
۲٫۸ اثر گذاری کلمات بر یکدیگر و نحوه تلفظ آنها    ۱۶
۳٫۸ کلمات متشابه (Homonym ها)    ۱۶
۴٫۸ ایجاد سرو صدا    ۱۷
نتیجه گیری    ۱۸
منابع:    ۱۹

منابع:

۱٫ابویی اردکانی،محمد؛ نادر نقشینه؛فاطمه شیخ شعاعی، ۱۳۸۵٫فناوری پردازش گفتار و کاربرد آن در کتابخانه ها. مجله روانشناسی و علوم تربیتی دانشگاه تهران (در دست چاپ).

۲٫”سیستم های شناسایی صدا”.بزرگراه رایانه.۹ (۹۵) ،۱۳۸۵٫

۳٫”دستگاههای مترجم جهانی”.بزرگراه رایانه.۸(۷۷) ،۱۳۸۴٫

۴٫”بدون محدودیت زبان سفر کنید”.روزنامه جام جم،۵ آذر،۱۳۸۵٫

۵٫Joseph R. Zumalt. “Voice Recognition Technology: Has It come of Age?”.Information Technology and Libraries,December 2005.

۶٫Kurzweil,Raymond.”The End of Handicaps,Part2″.Library Journal.9(117),1992.

۱. مقدمه

گفتار برای بشر طبیعی ترین و کارآمدترین ابزار مبادله اطلاعات است. کنترل محیط و ارتباط با ماشین بوسیله گفتار از آرزوهای او بوده است.طراحی و تولید سیستم های تشخیص گفتار هدف تحقیقاتی مراکز بسیاری در نیم قرن اخیر بوده است.یکی از اهداف انسانها در تولید چنین سیستم هایی مسلماً توجه به این نکته بوده است که “ورود اطلاعات به صورت صوتی ،اجرای دستورات علاوه بر صرفه جویی در وقت و هزینه ،به طرق مختلف کیفیت زندگی ما را افزایش می دهند.امروزه دامنه ای از نرم افزارها (که تحت عنوانSpeech Recognition Systems معرفی می شوند) وجود دارند که این امکان را برای ما فراهم کرده اند.با استفاده از این تکنولوژی می توانیم امیدوار باشیم که چالش های ارتباطی خود را با محیط پیرامون به حداقل برسانیم.

۲.تعریف

قبل از پرداختن به به سیستم های تشخیص گفتار لازم است که فناوری تولید گفتار و تشخیص گفتار با تعریفی ساده از هم متمایز شوند:

 ● فناوری تولید گفتار(Text To Speech):تبدیل اطلاعاتی مثل متن یا سایر کدهای رایانه ای به گفتاراست.مثل ماشین های متن خوان برای نابینایان،سیستم های پیغام رسانی عمومی. سیستم های تولید گفتار به خاطر سادگی ساختارشان زودتر ابداع شدند. این نوع از فناوری پردازش گفتار موضوع مورد بحث در این مقاله نیستند.

 ● فناوری تشخیص گفتار(Speech Recognition System ): نوعی فناوری است که به یک کامپیوتراین امکان را می دهد که گفتارو کلمات گوینده ای را که از طریق میکروفن یا پشت گوشی تلفن صحبت می کند،بازشناسی نماید. به عبارت دیگر در این فناوری هدف خلق ماشینی است که گفتار را به عنوان ورودی دریافت کند و آنرا به اطلاعات مورد نیاز (مثل متن)تبدیل کند.

۳.تاریخچه فناوری تشخیص گفتار

اولین سیستم های مبتنی بر فناوری تشخیص گفتار در سال ۱۹۵۲  در”آزمایشگاههای بل”طراحی شد.این سیستم به شیوه گفتار گسسته و به صورت وابسته به گوینده و با تعداد لغت محدود ۱۰ لغت عمل می کرد.در اوایل دهه ۸۰ میلادی برای اولین بار الگوریتم مدلهای مخفی مارکوف “Hidden Markov Model” ارائه شد.این الگوریتم گامی مهم در طراحی سیستم های مبتنی بر گفتار پیوسته به حساب می آمد.همچنین در طراحی این سیستم از مدل شبکه عصبی و نهایتاً ازهوش مصنوعی نیز استفاده می شود.در ابتدا شرکتهای تجاری این فناوری را برای کاربردهای خاصی طراحی کردند.به عنوان مثال شرکت Kurzweil در زمینه پزشکی و مخصوصاً برای کمک به معلولان و نابینایان و شرکت Dragon در زمینه خودکارسازی سیستمهای اداری محصولات اولیه وارد بازارکردند. توانجویان در واقع اولین گروهی بودند که از این دسته محصولات به عنوان یک فناوری انطباقی و یاریگر،عمدتاً برای دو عملکرد کنترل محیط و واژه پردازی استفاده کردند.
جیمز بیکر James K.Baker یکی از محققان شرکت IBM که در اواخر دهه ۱۹۷۰ در مورد این فناوری مقالات زیادی نوشت، یکی از پیشگامان این طرح بود.او و همکارانش یک شرکت خصوصی به نام Dragon Systems تاسیس کردند.این شرکت ابتدا در دهه ۱۹۹۰ نرم افزاری به نام Dragon Dictate تولید کرد که یک سیستم مبتنی بر گفتار گسسته بود.در سال ۱۹۹۷ این شرکت محصولی را تولید کرد که به جای استفاده از گفتارگسسته ،مبتنی بر گفتار پیوسته بود.در واقع این شرکت با ارائه نرم افزار Dragon Naturally Speaking (DNS) اولین سیستم تشخیص گفتار پیوسته را ارائه نمود.این سیستم توانایی تشخیص گفتار با سرعت ۱۶۰ کلمه در دقیقه را داشت.همچنین شرکت تجاری IBM هم در این زمینه برای سالهای متمادی فعالیت می کرد که با طراحی بسته نرم افزاری Via Voice به ارائه سیستم های تشخیص گفتار پرداخت که در حال حاضر Scansoft محصولات IBM Via Voice  راتوزیع و پشتیبانی می کند.شرکت مایکروسافت نیز فعالیتهایی درجهت تولید و کاربرد این فناوری داشته است،و بیل گیتس Bill Gates در کتابها و سخنرانی هایش به کرات در مورد آینده درخشان استفاده از سیستم های تشخیص گفتار تاکید کرده است. البته عملاً تا قبل از ارائه نرم افزار office XP وword 2002 این تکنولوژی در محصولات این شرکت بکاربرده نشد.گرچه در ابتدا عمده موارد استفاده این تکنولوژی ،برای افراد توانجو پیش بینی شده بود اما بعدها پذیرش استفاده از آن گسترده تر شد و گروههای بسیاری در مدارس و دانشگاهها علاقه مند به استفاده ازاین فناوری شدند. بطوریکه Seton Hall University نیز برای تشویق دانشجویان به آشنایی با این سیستم به دانجشویان جدید الورود نرم افزار IBM Via Voice را اهدا می کرد.

۴.عملکرد سیستم های تشخیص گفتار

سیستم های تشخیص گفتار به هر منظور که بکار برده شوند، عملکرد نسبتاً مشابهی دارند که عبارت است از:تبدیل گفتاربه داده و تحلیل آن توسط مدلهای آماری.

25,000 ریال – خرید

جهت دریافت و خرید متن کامل مقاله و تحقیق و پایان نامه مربوطه بر روی گزینه خرید انتهای هر تحقیق و پروژه کلیک نمائید و پس از وارد نمودن مشخصات خود به درگاه بانک متصل شده که از طریق کلیه کارت های عضو شتاب قادر به پرداخت می باشید و بلافاصله بعد از پرداخت آنلاین به صورت خودکار  لینک دنلود مقاله و پایان نامه مربوطه فعال گردیده که قادر به دنلود فایل کامل آن می باشد .

مطالب پیشنهادی:
برچسب ها : , , , , , , , , , , ,
برای ثبت نظر خود کلیک کنید ...

به راهنمایی نیاز دارید؟ کلیک کنید

جستجو پیشرفته

پیوندها

دسته‌ها

آخرین بروز رسانی

    شنبه, ۸ اردیبهشت , ۱۴۰۳
اولین پایگاه اینترنتی اشتراک و فروش فایلهای دیجیتال ایران
wpdesign Group طراحی و پشتیبانی سایت توسط digitaliran.ir صورت گرفته است
تمامی حقوق برایbankmaghaleh.irمحفوظ می باشد.