- خانه
- نوشتارهای علمی
- عظیمداده: یادگیری عمیق برای تحلیل احساسات در حوزهی مالی
عظیمداده: یادگیری عمیق برای تحلیل احساسات در حوزهی مالی
نام مقاله: عظیمداده: یادگیری عمیق برای تحلیل احساسات در حوزهی مالی
Big Data: Deep Learning for financial sentiment analysis
ژورنال: Journal of Big Data
شماره: Volume 5, Issue 1
نویسندگان: Sahar Sohangir, Dingding Wang, Anna Pomeranets and Taghi M. Khoshgoftaar
سال انتشار: 2018
تعداد ارجاعات: 35
خلاصه: یادگیری عمیق و عظیمداده به عنوان دو حوزه مهم در علم داده مورد توجه هستند. یادگیری عمیق نتایج قابل توجهی در حوزههایی چون پردازش زبان طبیعی، بینایی ماشین و تشخیص گفتار حاصل نموده است و از سوی دیگر عظیمداده نیز برای سازمانهایی که نیازمند جمعآوری حجم زیادی از دادههایی نظیر دادههای شبکه اجتماعی هستند حائز اهمیت میباشد و یکی از داراییهای مهم برای به کارگیری یادگیری عمیق، تجزیه و تحلیل حجم زیادی از داده میباشد. این مزیت یادگیری عمیق را به عنوان ابزاری ارزشمند برای بیگ دیتا مطرح ساخته است و میتواند اطلاعات پنهان در عظیمداده را استخراج نماید. در واقع در حوزه عظیمداده ویژگیها و چالشهای متعددی مطرح است از جمله تنوع، حجم، سرعت در کنار چالشهایی نظیر مهندسی ویژگی، ابعاد بالا، پاکسازی دادهها و افزونگی دادهها و همچنین در این حوزه نیازمند تجزیه و تحلیل، تصمیمگیری و اقدام سریع میباشیم. فناوری مرتبط با عظیمداده نیز هنوز جوان بوده و با مسائلی در حوزه محاسبات جریانی، محاسبات موازی، معماری و مدل بیگ دیتا و سیستمهای نرمافزاری پشتیبان مواجهیم. روشهای یادگیری عمیق میتواند قدرت پیشبینیکنندگی عظیمداده را در حوزههای مختلف افزایش دهد.
در حوزه پردازش زبان طبیعی، فرآیند یادگیری سلسلهمراتبی در یادگیری عمیق به یافتن معانی و ارتباط کلمات کمک میکند و از این رو آنرا به یکی از مدلهای مطلوب برای تحلیل احساسات تبدیل مینماید. در رویکرد دادهکاوی استاندارد برای دستهبندی متن، متون به عنوان بردارهایی از bag-of-word هستند. این بردارها نشان میدهد کدام کلمات در متن هستند اما ترتیب کلمات در جمله را در نظر نمیگیرند. حال آنکه ترتیب کلمات در جمله میتواند احساس مربوط به آن جمله را تغییر دهد. یک راهحل موجود استفاده از n-gram میباشد که استفاده از CNN فرصتی جهت به کارگیری n-gram برای استخراج احساسات متن به شیوهای مؤثر ارائه میدهد که با بهرهگیری از ساختار درونی داده که در متن وجود دارد از طریق لایههای کانولوشن انجام میگیرد.
میتوان گفت بازار بورس مدرن مثالی از شبکههای اجتماعی است. مسائلی که در این حوزه مطرح میشود، زمان خرید و فروش سهام و همچنین اینکه چه سهامی خریداری شود میباشد. آنچه در میان سرمایهگذاران مرسوم است استفاده از مشاوران مالی حرفهای است اما بهترین منبع برای پشتیبانی از تصمیمات این افراد چیست؟ بانکهای سرمایهگذاری معروف بیش از یک دهه در عرصه مشاوره مالی غالب بودهاند با این حال با گسترش اینترنت و شبکههای اجتماعی مالی نظیر StockTwits و SeekingAlpha، سرمایهگذاران در سرتاسر دنیا فرصت جدیدی برای جمعآوری و به اشتراکگذاری تجربیاتشان دارند. متخصصان میتوانند حرکت بازار بورس را در شبکههای اجتماعی مالی با دقت قابل قبولی پیشبینی نمایند. آنچه در این مقاله به آن پرداخته شده است پاسخ به این سؤال است که احساسات یا نظر گروه وسیعی از این مختصصان در خصوص سهامهای مختلف چه میباشد؟ و تعیین اینکه آیا مدلهای یادگیری عمیق میتواند جهت بهبود عملکرد تحلیل احساسات بر روی StockTwits پذیرفته شوند؟
در ابتدا نویسندگان به بررسی ارتباط میان قیمت آتی سهام و احساسات کاربران با استفاده از ضریب همبستگی پیرسون پرداختهاند و از یادگیری عمیق برای تحلیل احساسات نویسندگان برتر در این شبکه اجتماعی استفاده شده است. مدلهای شبکه عصبی نظیر LSTM، Doc2vec، CNN بر روی مجموعه دادههای StockTwits اعمال شده است و با الگوریتم LR مقایسه شدهاند. مجموعه دادههای StockTwits به عنوان یک شبکه اجتماعی مالی در سال 2009 ایجاد شده است و شامل اطلاعاتی از بازار بورس نظیر آخرین قیمتها، تغییرات قیمت، تاریخچه مبادلات بورس، توصیههای مبتنی بر خرید یا فروش و ... میباشد. علاوه بر این به عنوان یک شبکه اجتماعی امکان تبادل تجربیات میان معاملهکنندگان در بازار بورس را شامل میشود.
نتایج به دست آمده در این مقاله نشان میدهد مدل یادگیری عمیق میتواند به نحو مؤثری برای تحلیل احساسات در حوزه مالی استفاده شوند و CNN در مقایسه با سایر الگوریتمهای به کار گرفته شده به عنوان بهترین مدل برای پیشبینی احساسات بر روی مجموعه دادههای StockTwits معرفی شده است و عملکرد بهتری نسبت به LR نشان داده است و استفاده از CNN برای پیشبینی احساس افراد در شبکه اجتماعی مذکور توانسته است حرکتهای آتی بازار را پیشبینی نماید.
بخشهای مختلف این مقاله شامل مرور کارهای انجام شده در حوزه تحلیل احساسات دادههای صنعت مالی و روشهای به کار گرفته شده در آن، مروری بر تحلیل بیگ دیتا، بحث بر روی روشهای تحلیل احساسات و مزایای به کارگیری یادگیری عمیق برای تحلیل احساسات و همچنین بررسی روشهای مختلف دادهکاوی جهت انجام تحلیل احساسات بر روی دیتاست StockTwits میباشد و در نهایت استفاده از یادگیری عمیق برای تحلیل عظیمداده مورد بررسی قرار گرفته است و چالشهای پیش رو در تحلیلهای حوزه عظیمداده مطرح گردیده است.
دسته بندی
- معرفی ابزار 26
- مطالعه موردی 27
- کتاب بخوانیم 49
- معرفی کتاب 31
- مرور منابع علمی 33
- اینفوگرافیک 7
- تجربه داخلی 4
- مصاحبه 22
- معرفی کسب و کار داده محور 9
- معرفی سرویس 7