ما در طی سالها در خدمات مالی مدل های مختلف یادگیری ماشین (ML) را ساخته و/یا یکپارچه کرده ایم. موفقیت این پروژه ها به طور کلی در نیازهای تنگ و کیفیت داده های خوب نهفته است. در زیر برخی از موارد آماده سازی مبتنی بر کار NLP که ما برای میز تجاری یک بانک سرمایه گذاری مستقر در NYC انجام دادیم (البته با اجازه استفاده می شود). دلیل برای بررسی عمیق تر در این مطالعه موردی ، نشان دادن چالش های زندگی واقعی و توضیح اینکه چرا برای یادگیری ماشین و هوش مصنوعی در وال استریت بسیار تأثیر می گذارد.
تأثیر احساسات از منابع خبری بر قیمت ابزارهای تجاری
تجزیه و تحلیل احساسات به عنوان یک تعریف شده است: "فرایند شناسایی محاسباتی و طبقه بندی نظرات بیان شده در یک متن ، به ویژه برای تعیین اینکه آیا نگرش نویسنده نسبت به یک موضوع خاص ، محصول و غیره مثبت ، منفی یا خنثی است."
ما یک موتور تجزیه و تحلیل احساساتی برای برجسته کردن شرکت هایی که تأثیر معنی داری بر احساسات بر اساس داده های خبری و اطلاعات فید توییتر دارند ، ایجاد کردیم. سپس این برای ایجاد یک الگوریتم تجاری برای گرفتن آلفا در برابر معامله گران انسانی استفاده شد.
دلتا (تغییر) در بازارهای مایع (مانند سهام ، اوراق قرضه Corp ، گزینه ها ، معاملات آتی کالاها و غیره) یک اقدام شگفت انگیز برای تشخیص تجزیه و تحلیل احساسات است. از نظر تئوری ، توییتر ، Bloomberg Breaking News ، Feed News Reuters باید قناری در میدان مین برای ورود به بازار باشد. یک موتور احساساتی باید بتواند ورودی ها را از منابع اخبار "سریعتر" پردازش کند و شاخص اولیه تغییر قیمت سهام یا اوراق قرضه یک شرکت را ارائه دهد. در حالت ایده آل ، این موتور باید قبل از اینکه بازار به آن برسد ، تغییر نوسانات را پیش بینی کند.
سطح نوسانات نسخه وال استریت تجزیه و تحلیل احساسات است
زیبایی نوسانات سهام عدالت این است که می توان زیر حرکت قیمت سهام حفر کرد تا آنچه را که در واقع در مشخصات ریسک یک شرکت خاص اتفاق می افتد ، تجزیه کند. بدون اینکه به جزئیات هجوم "یونانیان" بپردازید ، مهم است که درک کنید که وگا معادل SA در تجارت صحبت می کند. با استفاده از گزینه ها ، می توان نه تنها به مقدار مطلق حرکت ابزار (اوراق قرضه ، سهام و غیره) شرط بندی کرد ، بلکه زمانی است که انتظار می رود حرکت اتفاق بیفتد.
"ربات" برای تجارت گام های مختلف ETF با استفاده از تجزیه و تحلیل احساسات توییتر
ما یک موتور اختصاصی تجزیه و تحلیل احساسات را آموزش دادیم که فیدهای اخبار توییتر، سطح نوسان (1 سال گذشته) را برای ETFهای اصلی می گرفت و الگوریتمی برای خرید و فروش گاما ایجاد کرد. در آزمایشهای تاریخی، نتایج ارزش آن را داشت.
برخی از افکار در مورد عملکرد ربات تجاری ما
در طی چند ماه، PnL (سود/زیان) «ربات» را در برابر بازارسازان انسانی اندازهگیری کردیم. من نمی توانم واقعیات را در اینجا افشا کنم اما می توانم به طور کلی موارد زیر را بگویم:
1) False Positives and Incorrect Signals became too annoying for the human traders. Although, we were able to eliminate >70 درصد از این موارد نسبتاً سریع، فرآیند تمیز کردن سر و صدا برای رفع کامل آن بسیار دشوار بود. صندوقهای سرمایهگذاری موفق Quant Hedge Funds این مشکلات را حل کردهاند، اما نیاز به یک تیم بزرگ دارد و صادقانه بگویم که میزهای معاملاتی زیادی از امکانات و تخصص برخوردار نیستند.
2) سیگنالهای غیرقابل معامله: تقریباً یک سوم سیگنالهای صحیح نسبت به پیشنهاد/پیشنهاد بسیار کوچک بودند و ارزش عمل کردن را نداشتند.
3) مدلهای Risk به دلیل اینکه علامتگذاری PnL روی قیمتهای اواسط تا متوسط انجام میشد، هرچند برای حرکات کم، بیشتر به صورت خطی کار میکردند. اگرچه در جابجایی های بزرگ (جایی که اخبار بیشتر به صورت عمومی منتشر می شد، مانند درآمد)، SA بیش از حد نیاز، تقلبی ایجاد کرد.
4) سیگنالهای صبح زود/پیش باز مانند اخبار بازارهای نوظهور (که در زمان بسته شدن بازارهای ایالات متحده باز بودند) مفید نبودند. این به این دلیل بود که در بیشتر موارد، بازارهای نوظهور روز قبل از S& P پیشی گرفتند و فهمیدن اینکه چه چیزی ابتدا حرکت می کند، مانند تصمیم گیری بود که آیا دم سگ را تکان می دهد یا برعکس.
خلاصه
به طور کلی، حجم و کیفیت داده ها عوامل کلیدی در آموزش هر مدل ML هستند. اگرچه بانک ها داده های زیادی دارند، اما با وظیفه دلهره آور ساختن داده ها برای مدیریت ریسک و تجارت مواجه هستند. دشواری پیادهسازی یک مدل ساده با مجموعه دادههای بزرگ مانند اخبار و قیمتهای بازار تنها گوشهای از چالشهای گستردهتر یافتن دادههای خوب برای آموزش مدلهای ML در امور مالی است.
Polymer یک پلت فرم پیشگیری از از دست دادن داده بدون کد (DLP) است که به شرکت ها امکان نظارت، اصلاح خودکار و استفاده از تکنیک های رفتاری برای کاهش خطر تهدیدات داخلی، سوء استفاده از داده های حساس و نشت از برنامه های SaaS شخص ثالث را می دهد. پلیمر را به صورت رایگان امتحان کنید.