با استفاده از تجزیه و تحلیل احساسات مبتنی بر پردازش زبان طبیعی (NLP) برای ریسک و تجارت: کیف مختلط!

  • 2022-10-20

NLP HIPAA

ما در طی سالها در خدمات مالی مدل های مختلف یادگیری ماشین (ML) را ساخته و/یا یکپارچه کرده ایم. موفقیت این پروژه ها به طور کلی در نیازهای تنگ و کیفیت داده های خوب نهفته است. در زیر برخی از موارد آماده سازی مبتنی بر کار NLP که ما برای میز تجاری یک بانک سرمایه گذاری مستقر در NYC انجام دادیم (البته با اجازه استفاده می شود). دلیل برای بررسی عمیق تر در این مطالعه موردی ، نشان دادن چالش های زندگی واقعی و توضیح اینکه چرا برای یادگیری ماشین و هوش مصنوعی در وال استریت بسیار تأثیر می گذارد.

تأثیر احساسات از منابع خبری بر قیمت ابزارهای تجاری

تجزیه و تحلیل احساسات به عنوان یک تعریف شده است: "فرایند شناسایی محاسباتی و طبقه بندی نظرات بیان شده در یک متن ، به ویژه برای تعیین اینکه آیا نگرش نویسنده نسبت به یک موضوع خاص ، محصول و غیره مثبت ، منفی یا خنثی است."

ما یک موتور تجزیه و تحلیل احساساتی برای برجسته کردن شرکت هایی که تأثیر معنی داری بر احساسات بر اساس داده های خبری و اطلاعات فید توییتر دارند ، ایجاد کردیم. سپس این برای ایجاد یک الگوریتم تجاری برای گرفتن آلفا در برابر معامله گران انسانی استفاده شد.

دلتا (تغییر) در بازارهای مایع (مانند سهام ، اوراق قرضه Corp ، گزینه ها ، معاملات آتی کالاها و غیره) یک اقدام شگفت انگیز برای تشخیص تجزیه و تحلیل احساسات است. از نظر تئوری ، توییتر ، Bloomberg Breaking News ، Feed News Reuters باید قناری در میدان مین برای ورود به بازار باشد. یک موتور احساساتی باید بتواند ورودی ها را از منابع اخبار "سریعتر" پردازش کند و شاخص اولیه تغییر قیمت سهام یا اوراق قرضه یک شرکت را ارائه دهد. در حالت ایده آل ، این موتور باید قبل از اینکه بازار به آن برسد ، تغییر نوسانات را پیش بینی کند.

سطح نوسانات نسخه وال استریت تجزیه و تحلیل احساسات است

زیبایی نوسانات سهام عدالت این است که می توان زیر حرکت قیمت سهام حفر کرد تا آنچه را که در واقع در مشخصات ریسک یک شرکت خاص اتفاق می افتد ، تجزیه کند. بدون اینکه به جزئیات هجوم "یونانیان" بپردازید ، مهم است که درک کنید که وگا معادل SA در تجارت صحبت می کند. با استفاده از گزینه ها ، می توان نه تنها به مقدار مطلق حرکت ابزار (اوراق قرضه ، سهام و غیره) شرط بندی کرد ، بلکه زمانی است که انتظار می رود حرکت اتفاق بیفتد.

"ربات" برای تجارت گام های مختلف ETF با استفاده از تجزیه و تحلیل احساسات توییتر

ما یک موتور اختصاصی تجزیه و تحلیل احساسات را آموزش دادیم که فیدهای اخبار توییتر، سطح نوسان (1 سال گذشته) را برای ETFهای اصلی می گرفت و الگوریتمی برای خرید و فروش گاما ایجاد کرد. در آزمایش‌های تاریخی، نتایج ارزش آن را داشت.

برخی از افکار در مورد عملکرد ربات تجاری ما

در طی چند ماه، PnL (سود/زیان) «ربات» را در برابر بازارسازان انسانی اندازه‌گیری کردیم. من نمی توانم واقعیات را در اینجا افشا کنم اما می توانم به طور کلی موارد زیر را بگویم:

1) False Positives and Incorrect Signals became too annoying for the human traders. Although, we were able to eliminate >70 درصد از این موارد نسبتاً سریع، فرآیند تمیز کردن سر و صدا برای رفع کامل آن بسیار دشوار بود. صندوق‌های سرمایه‌گذاری موفق Quant Hedge Funds این مشکلات را حل کرده‌اند، اما نیاز به یک تیم بزرگ دارد و صادقانه بگویم که میزهای معاملاتی زیادی از امکانات و تخصص برخوردار نیستند.

2) سیگنال‌های غیرقابل معامله: تقریباً یک سوم سیگنال‌های صحیح نسبت به پیشنهاد/پیشنهاد بسیار کوچک بودند و ارزش عمل کردن را نداشتند.

3) مدل‌های Risk به دلیل اینکه علامت‌گذاری PnL روی قیمت‌های اواسط تا متوسط انجام می‌شد، هرچند برای حرکات کم، بیشتر به صورت خطی کار می‌کردند. اگرچه در جابجایی های بزرگ (جایی که اخبار بیشتر به صورت عمومی منتشر می شد، مانند درآمد)، SA بیش از حد نیاز، تقلبی ایجاد کرد.

4) سیگنال‌های صبح زود/پیش باز مانند اخبار بازارهای نوظهور (که در زمان بسته شدن بازارهای ایالات متحده باز بودند) مفید نبودند. این به این دلیل بود که در بیشتر موارد، بازارهای نوظهور روز قبل از S& P پیشی گرفتند و فهمیدن اینکه چه چیزی ابتدا حرکت می کند، مانند تصمیم گیری بود که آیا دم سگ را تکان می دهد یا برعکس.

خلاصه

به طور کلی، حجم و کیفیت داده ها عوامل کلیدی در آموزش هر مدل ML هستند. اگرچه بانک ها داده های زیادی دارند، اما با وظیفه دلهره آور ساختن داده ها برای مدیریت ریسک و تجارت مواجه هستند. دشواری پیاده‌سازی یک مدل ساده با مجموعه داده‌های بزرگ مانند اخبار و قیمت‌های بازار تنها گوشه‌ای از چالش‌های گسترده‌تر یافتن داده‌های خوب برای آموزش مدل‌های ML در امور مالی است.

Polymer یک پلت فرم پیشگیری از از دست دادن داده بدون کد (DLP) است که به شرکت ها امکان نظارت، اصلاح خودکار و استفاده از تکنیک های رفتاری برای کاهش خطر تهدیدات داخلی، سوء استفاده از داده های حساس و نشت از برنامه های SaaS شخص ثالث را می دهد. پلیمر را به صورت رایگان امتحان کنید.

  • نویسنده : هاملت گریگوری مارکاریان
  • منبع : thehodutv.online
  • بدون دیدگاه

برچسب ها

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.