درباره محصول جدید با استفاده از کاوش متن‌های اینترنتی که بیانگر نیازهای مصرف‌کنندگان است استفاده می‌کند و علاوه بر آن از روش کاوش ایده به منظور کاوش وب8 برای پیدا کردن مشتریان و شرکت‌های سودآور استفاده می‌کند.
1-9 ساختار پایان‌نامه
در فصل دوم به بیان مقدمه و تاریخچه روش کاوش ایده و کاربرهای آن و سیستمهای خبره و مراحل مهندسی آن پرداخته می‌شود.
فصل سوم، به چگونگی ارزیابی روش داده‌های مورد نیاز برای آن و نحوه تجزیه و تحلیل آن می‌پردازد.
فصل چهارم، با توجه به روش کاوش ایده نحوه استفاده از آن در متون فارسی و کاربرد آن در سیستمهای خبره را بیان می‌کند.
فصل پنجم، شامل جمع‌بندی و ارائه پیشنهاداتی برای تحقیقات آینده است.

فصل دوم: ادبیات تحقیق

2-1 مقدمه
روش کاوش ایده روشی است که از تکنیک‌های کاوش متن و تکنیک جدیدی به نام کاوش ایده برای بدست آوردن ایده‌های جدید از متون غیر ساختار یافته استفاده می‌شود. این روش که در وزارت دفاع المان برای اولین بار ایجاد و به کار برده شد متنی که حاوی توضیح مسأله مطرح شده و متنی که احتمالاً ایده جدید برای حل این مسأله در آن مطرح شده است را به عنوان ورودی‌هایش دریافت می‌کند و با استفاده از تکنیک‌های که به کار می‌برد ایده‌های جدید و مفید را استخراج می‌کند و در نهایت با استفاده از روشی قابل درک برای کاربر آن را در خروجی نمایش می‌دهد.
ما در این تحقیق ابتدا در بخش 2-2 مروری اجمالی بر کاوش متن خواهیم داشت تا در مورد پایه و اساس روش کاوش ایده که کاوش متن است بحث کنیم. که در این قسمت بیشتر، کلیات کاوش متن که در کاوش ایده مورد استفاده قرار گرفته است را مورد بحث قرار می‌دهیم. در بخش بعدی تعریف ایده را بیان می‌کنیم تا با این کار از شبه‌هایی که در زمینه این واژه ممکن است وجود داشته باشد پرهیز کنیم و بتوانیم بر اساس این تعریف دامنه کار را بهتر مشخص کنیم. در بخش 2-4 به بررسی اساس و پایه ایجاد ایده می‌پردازیم تا بتوانیم نحوه به وجود آمدن این روش و در واقع ایده به وجود آمدن این روش را بهتر درک کنیم. در بخش 2-5 روش کاوش ایده را مورد بحث قرار می‌دهیم که مراحل مختلف این روش را به طور کامل شرح می‌دهد. در بخش 2-5-1 به ارزیابی روش کاوش ایده می‌پردازیم تا بتوانیم میزان دقت و صحت این روش را ببینیم.
در بخش بعدی کاربردهای کاوش ایده را بیان می‌کنیم. که در بخش 2-6-1 به کاربرد این روش در زمینه کسب و کار و برای یافتن سرویس‌های جدید اشاره خواهیم کرد. در بخش 2-6-2 کاربرد این روش در توسعه و تحقیق محصول9 جدید را بیان می‌کنیم. از آنجایی که ایده من در این مقاله علاوه بر پیاده‌سازی این روش به زبان فارسی به کار بردن آن در زمینه توسعه سیستمهای خبره است در بخش 2-7 مروری بر مفهوم سیستمهای خبره خواهیم داشت و در بخش 2-7-1 فرایند مهندسی دانش را مورد بررسی قرار می‌دهیم. در ادامه در قسمت 2-7-2 مراحل مهندسی دانش و در نهایت در بخش 2-7-2-1 مرحله کشف دانش را بیان خواهیم کرد.

2-2 کاوش متن
تکنیک کاوش متن به استخراج اتوماتیک اطلاعات از داده‌های متنی غیر ساختار یافته تخصیص داده می‌شود. تفاوت عمده کاوش متن با داده‌کاوی10 این است که داده‌کاوی استخراج اطلاعات از پایگاه داده‌های ساختار یافته است در حالیکه کاوش متن روی متن‌های غیر ساختار یافته کار می‌کند. کاوش متن برای کشف و استخراج اطلاعات از ساختار ضمنی متن‌ها به کار می‌رود و در پردازش زبان طبیعی11 نیز مورد استفاده قرار می‌گیرند [12].در واقع کاوش متن بخش خاصی از داده‌کاوی است که به عنوان فرایندی که اطلاعات با کیفیت بالا را از متن‌ها بدست می‌آورد به حساب می‌آید. کاوش متن یک فرایند سه مرحله‌ای است که متن ورودی را در اولین مرحله ساختار یافته می‌کند، الگوهای جدید و مشاهده نشده را در داده‌های متنی ساختار یافته در مرحله دوم شناسایی می‌کند و در مرحله سوم، نتایج را ارزیابی و تفسیر می‌کند [12].معمولاً مرحله اول در بسیاری از موارد کاربرد کاوش متن سیر یکسانی را دنبال می‌کند اما مرحله دوم و سوم بنا بر نیاز زمینه‌های خاص با هم متفاوت است. ابزارهای کاوش متن طی این سه مرحله ساخته می‌شوند و در زمینه‌های مختلف مورد استفاده قرار می‌گیرند. در مرحله اول که همان مرحله پیش پردازش12 است متن اولیه پاک‌سازی می‌شود (مثلاً از عکس یا تگ‌ها و… ). نشانه‌گذاری‌ها حذف و فرهنگ لغتی برای تصحیح خطاهای نوشتاری به کار برده می‌شود. سپس شناسه‌ها13 جدا می‌شوند که واحد اصطلاح کلمه است و تبدیل حروف (تبدیل اصطلاحات به حروف کوچک و بزرگ کردن کاراکتر اول جمله در زبان‌های که دارای حروف بزرگ و کوچک هستند) اعمال می‌شود.
معمولاً در قسمت فیلتر کردن متن چندین روش به کار می‌رود. ادات سخن نشانه‌گذاری شده برای شناسایی گروه نحوی اصطلاحات به کار برده می‌شود. فیلتر کلمات عمومی14 اغلب برای شناسایی اصطلاحات با اطلاعات کم یا بدون مضمون استفاده می‌شود. با ریشه‌یابی15 بر اساس فرهنگ لغت ریشه کلمات (جایی که ریشه مشابه کلمات مرتبط ارائه می‌شود) شناسایی می‌شود.
مضافاً توزیع زیف 16برای کاهش تعداد اصطلاحات با استفاده از حذف اصطلاحات کمیاب به کار برده می‌شود. بعد از این کار اصطلاحات انتخاب شده به صورت دستی چک می‌شوند. سپس بردارهای متنی ساخته می‌شوند. در مرحله دوم از این بردارهای متنی با شیوه‌های مختلف جهت استخراج اطلاعات استفاده می‌شود تا الگوهای جدید را کشف کند. که در نهایت این الگوها برای ارزیابی میزان مفید بودنشان در مرحله سوم مورد ارزیابی قرار می‌گیرند.
ابزار کاوش متن17 در این فرایند سه مرحله‌ای ساخته می‌شوند تا بتوان از آن در زمینه‌های مختلف بهره جست. همان‌طور که حجم داده‌های غیر ساختار یافته در حال افزایش است، ابزار کاوش متن که آن‌ها را وارسی می‌کند به صورت فزاینده با ارزش می‌شوند. برای مثال، ابزارهایی که در زمینه‌های پزشکی به کار گرفته می‌شوند، که حجم اطلاعات در موضوع خاصی سبب شده که این کار برای یک محقق غیر ممکن باشد که تمام آن‌ها را کشف کند. روش‌های کاوش متن اغلب برای دولت و آژانس‌های امنیتی که سعی دارند هشدارهای تروریستی و دیگر تهدیدهای امنیتی را قبل از اینکه شانس رخ دادن داشته باشند را پیدا کنند، مفید است، آموزش، حیطه دیگری است که کاوش متن در آن بسیار مفید واقع شده است. دانش‌آموزان و آموزگاران بهتر قادر خواهند بود که اطلاعات مربوط به موضوع‌هایشان را نسبت به روش‌های سنتی پیدا کنند. برای محققان کاوش متن، کاربردهای تجاری می‌توانند هدف بسیار امیدبخشی باشد. ابزارهای کاوش متن می‌تواند به شرکت‌ها در آنالیز رقیبانشان، پایگاه مشتری و استراتژی‌های بازاریابی کمک کند [13]. این تنها قسمتی از کاربردهای کاوش متن است و استفاده از آن در تمام زمینه‌ها به سرعت در حال افزایش است. اهمیت فزاینده کاوش متن در مقابل رشد چشمگیر حجم اطلاعات بیشتر نمایان می‌شود و محققان در همه زمینه‌ها به اهمیت استفاده از این روش برای رقابت و پیشی گرفتن در بازارهای جهانی واقف هستند.
2-3 ایده چیست
ما در اینجا ایده را از دیدگاه تکنولوژیکی تعریف می‌کنیم. در این دیدگاه تعریف ایده ترکیبی از دو چیز است: معنی18 و هدف وابسته19. مثالی برای ایده ترانزیستور است. ترانزیستور وسیله‌ای نیمه رسانا است که می‌تواند به منظور تقویت یا سوئیچ سیگنال‌های الکترونیکی به کار برده می‌شود. در اینجا ما معنی (وسیله نیمه رسانا) و هدف وابسته (تقویت یا سوئیچ سیگنال‌های الکترونیکی) را داریم. به طور کلی در اینجا بحث از یک ایده جدید است به این معنی که اگر معنی شناخته شده مربوط به هدفی ناشناخته باشد یا اگر هدف شناخته شده مربوط به معنی ناشناخته باشد. بنابراین ایده جدید می‌تواند نانو مگنت باشد زیرا نانو مگنت آهنربای کوچک شده‌ای است که می‌تواند برای تقویت یا سوئیچ سیگنال به کار رود. در این مثال معنی ناشناخته نانو مگنت و هدف شناخته شده تقویت سیگنال را دایم. این ایده جدید می‌تواند مفید باشد زیرا در آینده نانو مگنت می‌تواند جایگزین ترانزیستور شود [7]. بنابراین ایده تکنولوژیکی تنها معنی جدید را ارائه نمی‌دهد بلکه اغلب هدف جدید و معنی ترکیبی را بیان می‌کند. به وسیله شناسایی سیستماتیک هدف‌ها، معنی‌ها و ترکیب هدف و معنی در متن‌های تکنولوژیکی غیر ساختار یافته، جستجوگر اتوماتیکی ایده می‌تواند به کار برده شود. در واقع همین ایده‌های جدید اساس پروژه‌های تحقیقی20 جدید هستند. این به این معنی است که برای طرح‌ریزی برنامه پروژه‌های تحقیقی لازم است که ایده‌های تکنولوژیکی جدید از جامعه علمی به عنوان اساس پروژه‌های تحقیقی آینده شناسایی شود [8].
در این تحقیق به واژه ایده با چنین تعریف و دیدگاهی نگریسته می‌شود و هدف در اینجا پیدا کردن ایده‌های جدید است تا بتواند پایه‌ای برای تحقیقات آینده و حل مسائلی باشد که پیش خواهند آمد.
2-4 اساس و پایه در پشت ایجاد ایده
ایجاد ایده یک موضوع شناخته شده است که مرتبط با خلاقیت در علم شناخت و روان شناسی است. توضیح اولیه فرایند خلاق به وسیله (Wallws) انتشار یافت. مدل مرحله‌ای او بینش‌های خلاق و اشراق را برای پیدا کردن راه حل مسأله توضیح می‌دهد. این مدل شامل فرایندی 4 مرحله‌ای است. در مرحله اول «آماده سازی»21 مسأله آنالیز می‌شود. به طوری که شخص نحوه ایجاد مسأله را تشخیص می‌دهد.
مرحله دوم «نهفتگی/ علامت»22 و مرحله سوم «روشن سازی»23 مسأله را از ذهن آگاه به ذهن نا خود آگاه انتقال می‌دهد. ذهن ناخود آگاه روی مسائل آگاهانه کار می‌کند و شاید راه حل را به وسیله بینش‌ها و روشن سازی‌های خلاق پیدا کند. این راه حل به ذهن آگاه انتقال می‌یابد، به این معنی که بعد از مدتی شخص ناگهان یک ایده دریافت می‌کند که برای او جدید است و شاید مسأله را حل کند.
در مرحله آخر «ارزیابی»24، ایده برای تازگی و سودمندی تست خواهد شد.
یکی از بهترین روش‌های شناخته شده عمل گرایی استفاده از خلاقیت عملی، طوفان فکری25 است.
مرحله اول در طوفان فکری، تعریف مسأله به وسیله ایجاد توضیحات مسأله است. سپس، اشخاص ایده‌های جدید را با استفاده از روش‌های خلاقانه مانند ارتباط ایده و غیره تولید می‌کنند.
مرحله‌ی آخر در فرایند طوفان فکری خوشه بندی ایده‌های تولید شده و ارزیابی آن برای تازگی و سودمندی است.
علاوه بر این، چندین رویکرد دیگر در ارتباط با خلق ایده جدید وجود دارد. ما می‌توانیم از تمام این رویکردها یاد بگیریم که برای خلق ایده‌ها سه مرحله ضروری است.
مرحله اول تمرکز روی مسأله است، مرحله دوم تولید بعضی ایده‌های جدید به خصوص برای مسأله با استفاده از متدهای خلاقانه است و مرحله سوم ارزیابی ایده‌های تولید شده برای تازگی و سودمندی در رابطه با مسأله است. در ارجاع به این رویکردها یک پایه مناسب برای فرایند کاوش ایده ساخته شد.
بنابراین، کاوش ایده اغلب شامل سه مرحله است. در مرحله اول، روی مسأله تمرکز می‌کنیم. اینجا کاربر رویکرد کاوش ایده باید اطلاعات متنی را مهیا کند جایی که او مسأله خاصی را توضیح می‌دهد. مرحله 2، کاربر باید اطلاعات متنی بیشتری که شامل ایده‌های جدید و مفیدی است که احتمالاً می‌تواند راه‌حلی برای مسأله او باشد را مهیا کند. ایده‌ها در عبارات متنی داخل این متن جدید26 قرار دارند.
بنابراین با یک فرایند اتوماتیک ما تعداد بسیار زیادی از عبارات متنی روی هم رفته را از متن جدید استخراج می‌کنیم که این عبارات متنی، الگوهای متنی27 نامیده می‌شوند. 38 درصد تمام الگوهای متنی استخراج شد

دسته بندی : No category

دیدگاهتان را بنویسید