داده های گمشده ناشی از گسل های سنسور یک مشکل شایع در سیستم های نظارت بر سلامت ساختاری است. با توجه به اثرات منفی ، بسیاری از روش هایی که داده های اندازه گیری شده را برای استنباط داده های از دست رفته اتخاذ می کنند ، برای مقابله با این مشکل در مطالعات قبلی پیشنهاد شده است. با این حال ، گرفتن همبستگی های پیچیده از داده های اندازه گیری یک چالش مهم است. در این مطالعه ، تجزیه حالت تجربی (EMD) همراه با یک واحد مکرر دروازه دو طرفه (BIGRU) برای بازیابی داده های اندازه گیری شده پیشنهاد شده است. EMD-BIGRU پیشنهادی وظیفه داده های گمشده را به عنوان وظیفه پیش بینی شده توالی زمان تبدیل می کند. هسته اصلی این روش پیش بینی داده های مفقود شده با استفاده از داده های خام و دنباله ای است که به دلیل توالی تجزیه شده می تواند دقت پیش بینی شده را بهبود بخشد. علاوه بر این ، BIGRU در مدل ترکیبی می تواند همبستگی های قبل از پست را در مقایسه با شبکه های عصبی مصنوعی سنتی استخراج کند. داده های شتاب خام جمع آوری شده از یک ساختار سه طبقه برای ارزیابی عملکرد EMD-BIGRU برای تغییر داده های از دست رفته استفاده می شود. نتایج بازیابی داده های اندازه گیری نشان می دهد که EMD-BIGRU از دو منظر عملکرد عالی دارد. اول ، توالی تجزیه شده می تواند دقت مدل پیش بینی شده Bigru را بهبود بخشد. دوم ، Bigru از سایر الگوریتم های یادگیری ماشین بهتر عمل می کند زیرا تغییرات میکروسکوپی بیشتری از داده های اندازه گیری شده را ضبط می کند. تجزیه و تحلیل تجربی نشان می دهد که الگوهای تغییر داده های سیگنال اندازه گیری شده RAW پیچیده است ، بنابراین استخراج ویژگی ها قبل از مدل سازی قابل توجه است.
1. مقدمه
سیستم های نظارت بر سلامت ساختاری (SHM) بر روی زیرساخت های بحرانی مانند پل های بزرگ اسپان نصب شده است [1]. در طی مراحل نظارت طولانی مدت ، SHM با تجزیه و تحلیل پاسخ داخلی ، تحریک خارجی و تأثیرات زیست محیطی ، یک روش تحقیق مهم برای ساختارهای مدنی ارائه می دهد. عملکرد طولانی مدت سیستم های SHM می تواند مقادیر زیادی از داده های حسی را جمع کند ، که در ارزیابی ایمنی ساختاری و ثبات مفید است. با این حال ، انواع معمولی از گسل های سنسور وجود دارد: (الف) رانش سنسور ، (ب) خرابی کامل ، (ج) تخریب دقیق و (د) داده های از دست رفته به دلیل خرابی تجهیزات ، زمین می چرخد ، سر و صدای با فرکانس پایین از لرزش محیطی، و غیره. در مشکل فوق ، داده های گمشده یک خطای رایج در سیستم های SHM است و بر داده های کاوی تأثیر می گذارد تا منجر به نتایج گمراه کننده شود. علاوه بر این ، عوامل مختلفی مانند تداخل ارتباطات شبکه و عدم موفقیت تجهیزات می توانند منجر به داده های گمشده شوند [2]. داده های تکمیل شده عامل مهمی در اطمینان از ایمنی شرایط زیرساخت است. بدون تغییر صحیح ، داده های از دست رفته می توانند به طور قابل توجهی بر سیگنال های اندازه گیری شده القاء تخمین های نادرست برای پارامترهای معین تأثیر بگذارند [3]. متأسفانه ، روشهای موجود می توانند به طور موثری تمامیت سیگنال اندازه گیری شده را تضمین کنند. بنابراین ، بسیاری از کارشناسان و محققان فناوری ساخته شده را برای بازیابی داده های گمشده برای پشتیبانی از کاربرد سیستم های SHM مطالعه کرده اند.
مقادیر زیادی از داده های نظارتی گم شده و خراب می تواند دقت الگوریتم ها یا تحلیل مدل را کاهش دهد، که می تواند انحرافات زیادی را در استنتاج های آماری خاص یا تصمیم گیری ایجاد کند. برای کاهش خطر استنتاج نادرست و بهبود ارزیابی سلامت ساختاری، یافتن روشهای مناسب برای مدیریت دادههای از دست رفته در SHM ضروری است. در سالهای اخیر، بسیاری از محققان روشهای زیادی را برای رفع این مشکل ارائه کردهاند. یکی از روش ها تلاش می کند تا سیگنال کامل را از داده های حسی خام بازسازی کند. مانند، بائو [4] روشی برای تعمیر داده های گمشده با استفاده از فناوری سنجش بی سیم با حرکت سریع پیشنهاد کرد و مکانیسم آن را از طریق تجزیه و تحلیل تجربی بررسی کرد. این نشان داد که اثر داپلر عامل اصلی منجر به داده های از دست رفته است. بر این اساس، بائو فناوری نمونه برداری فشرده را برای بازیابی داده های از دست رفته اتخاذ کرد و اثربخشی آن را با داده های نظارت بر شتاب از پل Songpu در هاربین، چین تأیید کرد. Huang [5] یک الگوریتم نمونه برداری فشرده بیزی پیشنهاد کرد که می تواند برای بازسازی سیگنال های تقریباً پراکنده استفاده شود و برای ترمیم سیگنال های شتاب از دست رفته در نظارت بر سلامت اعمال شود. وی خاطرنشان کرد که این الگوریتم برای سیگنالهای با سطوح پراکندگی پایین به همان اندازه مؤثر است. هونگ [6] از دو فیلتر پاسخ ضربه محدود برای بازسازی جابجایی و سرعت حاصل از شتاب استفاده کرد. سپس این روش با استفاده از داده های تونل باد مورد ارزیابی قرار گرفت و نتایج تجربی نشان داد که روش پیشنهادی از دقت بالایی برخوردار است.
در همین حال، با توجه به اینکه دادههای گمشده تصادفی معادل دادههای فشرده در سنجش فشاری است، بائو [7] کاربرد تئوری سنجش فشاری را برای بازیابی دادههای گمشده از حسگرهای بیسیم پایش سلامت سازه مورد مطالعه قرار داد. او تکنیک های دمدولاسیون تصادفی را برای جاسازی الگوریتم فشرده سازی آگاه در حسگرهای بی سیم اتخاذ کرد. نتایج آزمایش میدانی بر روی پل Songpu در هاربین نشان داد که بازسازی داده های گمشده بر اساس الگوریتم نظری آگاه از فشرده سازی امکان پذیر است. Zou [8] یک الگوریتم تعمیر داده های از دست رفته را بر اساس نمونه های فشرده در شتاب سنج بی سیم Imote2 تعبیه کرد تا مشکلات داده های از دست رفته را در طول انتقال سیگنال مدیریت کند. این نشان داد که کیفیت بازسازی سیگنال تحت تأثیر سطح نویز سیگنال و نرخ داده از دست رفته قرار دارد. لیو [9] ترکیبی از استراتژی فضای حالت و تجزیه ارزش منفرد را برای بازسازی سری های زمانی چند متغیره جمع آوری شده از سیستم های سلامت ساختاری پیشنهاد کرد. این مدل می تواند به طور موثری همبستگی بین متغیرهای چند متغیره را تعیین کرده و داده های از دست رفته را پر کند. وان [10] داده های SHM را با تجزیه و تحلیل توابع کوواریانس مختلف بین داده های پاسخ جمع آوری شده و یادگیری چند وظیفه ای بر اساس نظریه بیزی بازسازی کرد. نتایج تجربی نشان داد که روش در مقایسه با روش های سنتی از دقت بالایی برخوردار است. یانگ [11] مشکل بازسازی سیگنالهای ارتعاشی از دست رفته تصادفی را مورد مطالعه قرار داد و اشاره کرد که سیگنالهای شتاب تک کانالی دارای ویژگیهای پراکندگی دامنه فرکانس عمومی هستند در حالی که ماتریسهای تشکیلشده از سیگنالهای شتاب چند کاناله در تجزیه ارزش منفرد رتبه پایینی دارند. بر این اساس، او روشی را مبتنی بر بازسازی سیگنال پراکنده بهینه مبتنی بر محدودیت پارامتری ℓ1 و روش تکمیل ماتریس درجه پایین بهینه مبتنی بر محدودیت پارامتری هستهای پیشنهاد کرد.
نوع دیگری از روش سعی در استفاده از مقادیر تخمینی به عنوان جایگزینی داده های از دست رفته داشت که در آمار درون یابی نامیده می شود. با توجه به اینکه درون یابی داده ها از دیرباز به عنوان ابزاری متداول برای حل و فصل داده های از دست رفته مورد استفاده قرار گرفته است، بسیاری از محققین مطالعات گسترده ای در این زمینه انجام داده اند و روش های درون یابی مانند استفاده از همبستگی مکانی و زمانی برای پر کردن مقادیر از دست رفته، مدل های میانگین متحرک خودرگرسیون،یادگیری ماشین و روش های دیگرچوی [12] مشکل داده های کرنش از دست رفته را در نظارت بر ساخت ستون های بزرگ مورد مطالعه قرار داد. در این مقاله، یک معادله رابطه تحلیلی برای دادههای پایش کرنش بین نقاط اندازهگیری مختلف در سطح مقطع یک مگا ستون استخراج شد و دادههای کرنش محوری از دست رفته بر این اساس تعمیر شدند. او [13] مسئله داده های گمشده را برای مکان های بحرانی سازه های بدون حسگر نصب شده تعریف کرد و سپس یک مدل ترکیبی بر اساس مدل سازی اجزا محدود و تجزیه مدل تجربی برای حل این مشکل پیشنهاد کرد. این نشان داد که روش پیشنهادی میتواند دادهها را مستقیماً در حوزه زمانی با دقت بالا بازسازی کند. با توجه به اینکه سنسورها دارای اجزای فاز غیر خطی هستند، چن [13] یک روش توزیع مشترک غیر پارامتری را برای رسیدگی به داده های از دست رفته با در نظر گرفتن همبستگی بین کرنش های مختلف حسگر پیشنهاد کرد. لو [14] مکانیسم تلفات داده های نظارت ساختمان فولادی را مطالعه کرد و علل نظارت بر داده های از دست رفته آن را به سه دسته طبقه بندی کرد: خرابی انتقال داده، خرابی برق سیستم نظارت، و خرابی تجهیزات نظارت. بر این اساس، وی روش جبران داده های گمشده را بر اساس رگرسیون خطی پیشنهاد کرد. ژانگ [15] اطلاعات نسبی دادههای تنش را برای بازیابی دادههای تنش از دست رفته از پایش ساختمان فولادی مرکز المپیک هانگژو با استفاده از مدل رگرسیون خطی اتخاذ کرد. از آنجایی که داده های جمع آوری شده توسط SHM غیر خطی و غیر ثابت هستند، روش سنتی در مدیریت داده های غیر خطی ضعیف است.
با پیشرفت سریع هوش مصنوعی ، از روشهای یادگیری عمیق برای بازیابی داده های مفقود شده استفاده شده است که توجه گسترده ای از جامعه دانشگاهی به خود جلب کرده است. از آنجا که داده های سنسور جمع آوری شده از SHM متعلق به داده های توالی زمان است ، روشهای یادگیری عمیق موجود مانند حافظه کوتاه مدت طولانی (LSTM) [16] ، واحد مکرر دروازه دو طرفه (BI-GRU) [17] ، واحد مکرر دروازه (GRU)[18] ، و شبکه Convolutional [19] توانایی بسیار خوبی در رسیدگی به داده های توالی زمان دارند و می توانند به طور موثری داده های مفقود شده را بازیابی کنند. مانند ، لیو [20] یک روش بازیابی داده را بر اساس یک الگوریتم یادگیری عمیق LSTM برای بازیابی داده های گمشده دمای ساختاری پیشنهاد کرد. سپس ، وی به تفصیل در مورد کاربرد LSTM در دمای ساختاری بازیابی داده ها در پل رودخانه یانگ تسه بحث کرد. این نشان داد که روش پیشنهادی در پیش بینی داده های گمشده نسبت به شبکه های عصبی پشتیبانی و موجک برای داده های دما از دقت بالاتری برخوردار است. Guo [21] روشی را ارائه داد که از CNN برای بازیابی داده های لرزش گمشده در سیستم SHM استفاده کرد. در مرحله اول ، او از الگوریتم عمیق CNN برای استخراج رابطه غیر خطی بین داده های مفقود شده و واقعی استفاده کرد. سپس از CNN برای استخراج ویژگی های داده های ناقص از طریق لایه فشرده سازی استفاده شد و به تدریج این ویژگی ها را در لایه بازسازی گسترش داد تا داده های گمشده را بازیابی کند. عبد الیزیز [22،23] یک بهینه سازی متهوریستی پیشرفته به نام Aquila Optimizer را پیشنهاد کرد که در مقابله با داده های گمشده قدرتمند است. در الگوریتم های فوق ، مدل BIGRU یک روش داده محور است که به فرضیات زیادی احتیاج ندارد و می تواند به طور خودکار پارامترهای خود را مطابق با داده ها تنظیم کند. مهمتر از همه ، Bigru می تواند همبستگی های قبل از پست را از توجیه استخراج کند ، که می تواند برای ضبط تغییرات پیچیده حالت استفاده شود.
علاوه بر این ، برای به دست آوردن درک بهتر از تغییر داده های اندازه گیری شده ، می توان از تجزیه حالت تجربی (EMD) برای تجزیه داده های سیگنال قبل از استفاده از Bigru استفاده کرد. EMD یک روش تجزیه و تحلیل خود سازگار است که می تواند مجموعه ای از توابع حالت ذاتی (IMF) را ضبط کند [24]. Rezaei [25] از EMD برای تشخیص مکان های آسیب دیده در تیرها استفاده کرد و یک شبیه سازی آهن از پرتوی فولادی را برای تأیید اثربخشی روش پیشنهادی تهیه کرد. نتایج نشان داد که IMF ها الگوهای مختلف سیگنال اندازه گیری شده RAW را نشان می دهند. گائو [26] از طریق EMD اندازه گیری شده و آنها را به یک مدل شبکه عصبی تبدیل کرد. این نشان داد که روش پیشنهادی می تواند به طور مؤثر دقت توانایی پیش بینی شده را بهبود بخشد. او [13] از روش EMD برای تجزیه داده های پاسخ پویا جمع آوری شده توسط SHM استفاده کرد و پاسخ پویا را در مکان های بحرانی با استفاده از روش مدل سازی مدل حل کرد. نتایج تجربی در مدل پرتو عنصر محدود نشان داد که روش پیشنهادی از دقت بالایی برخوردار است.
به رسمیت شناختن توانایی های قوی EMD برای تجزیه داده های سیگنال اندازه گیری شده و BIGRU برای گرفتن همبستگی های قبل از پست ، یک مدل EMD-BIGRU در این مطالعه برای ایجاد داده های سیگنال اندازه گیری شده از دست رفته ارائه شده است. علاوه بر این ، شبکه های عصبی کم عمق نیز به عنوان مدل های پیش بینی استفاده می شوند که برای تأیید EMD-bigru پیشنهادی استفاده می شود. سرانجام ، از ساختار ساختمانی سه طبقه از آزمایشگاه ملی Los Alamos برای ارزیابی عملکرد EMD-bigru استفاده می شود [27]. ساختار ساختمان سه طبقه معمولاً برای ارزیابی SHM مبتنی بر یادگیری ماشین استفاده می شود.
مشارکت های اصلی این مقاله به شرح زیر خلاصه می شود.(1) یک تکنیک جدید بازیابی از دست دادن داده مبتنی بر حسگر با ترکیب EMD با BiGRU پیشنهاد شده است، که می تواند مستقیماً با مشکلات بازیابی داده ها مقابله کند و داده های از دست رفته را به طور دقیق بازیابی کند.(2) آزمایشهای جامع مبتنی بر یک سازه ساختمانی سه طبقه برای بررسی اثربخشی روش پیشنهادی استفاده میشود. نتایج نشان میدهد که روش پیشنهادی در طولهای از دست رفته مختلف به دقت بالایی دست مییابد. در همین حال، چندین تکنیک بازیابی ضرر موجود که بر روی الگوریتمهای یادگیری ماشین ساخته شدهاند، برای تجزیه و تحلیل انتخاب شدهاند و نتایج اثربخشی و برتری EMD-BiGRU را نشان میدهد.(3) بازیابی از دست دادن داده کل چارچوب یک روش مبتنی بر داده است و به برخی فرضیات داده ها و مدل FE وابسته نیست.
بخشهای باقیمانده این مقاله به شرح زیر سازماندهی شدهاند: بخش 2 پیشینه نظری EMD-BiGRU را معرفی میکند. بخش 3 تنظیمات آزمایشی را شامل مجموعه داده ها و پارامترهای الگوریتم های مختلف توصیف می کند. بخش 4 نتایج تجربی چهار مجموعه داده را با استفاده از روش پیشنهادی و روش سنتی تجزیه و تحلیل میکند. بخش 5 برخی از نتایج را بر اساس EMD-BiGRU و موضوعات بالقوه برای تحقیقات آینده خلاصه می کند.
2. معماری پیشنهادی EMD-BiGRU
2. 1. تجزیه حالت تجربی
تجزیه حالت تجربی، به عنوان یک پردازش داده با قابلیت های تطبیقی، می تواند سیگنال را بر اساس ویژگی های مقیاس زمانی خود داده تجزیه کند [28]. از آنجایی که EMD به هیچ توابع پایه از پیش تعریف شده نیاز ندارد، این تفاوت اساسی بین تجزیه EMD و ساختار تجزیه موجک بر اساس توابع پایه هارمونیک پیشینی و توابع پایه موجک است [29]. علاوه بر این، EMD برای مقابله با سریهای زمانی غیر خطی و غیر هموار به دلیل مدیریت سری دادهها یا سیگنالها، مناسب است. بنابراین، میتواند یک سیگنال پیچیده را به یک ترکیب خطی که شامل تعداد محدودی از توابع حالت ذاتی (IMF) با فرکانسهای مختلف از بالا تا پایین است، تجزیه کند، جایی که هر IMF ویژگیهای محلی سیگنال اصلی را در مقیاسهای زمانی مختلف نشان میدهد. بنابراین، روشهای مانیتورینگ مبتنی بر EMD اطلاعات حالتهای زیادی را از دادههای مانیتورینگ به دست میآورند که میتواند دقت پیشبینی دادههای از دست رفته را بهبود بخشد. جریان الگوریتم EMD به صورت زیر نشان داده شده است:
مرحله 1: تمام نقاط حداکثر و حداقل از داده های نظارتی X (t) یافت می شوند. سپس با استفاده از درون یابی اسپلاین مکعبی، حداکثر مقادیر e m a x (t) در منحنی پاکت فوقانی و حداقل e m i n (t) در منحنی پاکت پایینی تشکیل می شود. بنابراین، مقدار میانگین از پاکت های بالایی و پایینی m (t) = e m a x (t) + e m i n (t) / 2 محاسبه می شود.
مرحله 2: سیگنال میانی از طریق سیگنال اصلی به دست آمده و پوشش قطبی h (t) = X (t) - m (t) محاسبه می شود.
مرحله 3: تعیین اینکه آیا h (t ) دو شرط صندوق بین المللی پول را برآورده می کند یا خیر. در صورت رضایت، h (t) اولین صندوق بین المللی پول خواهد بود، یعنی i m f 1 (t) ، در غیر این صورت h (t) به عنوان سیگنال اصلی است و به مرحله 1 باز می گردد.
مرحله 4: جداسازی i m f 1 (t ) از سیگنال اصلی r (t ) = X (t ) - i m f 1 (t ) . هنگامی که r (t) یک تابع یکنواخت و r es (t) یک تابع باقیمانده است، آموزش پایان تکرار.
جایی که r e s (t ) نشان دهنده باقیمانده است، n تعداد IMF ها، X (t) سیگنال اصلی است، و i m f i (t) نشان دهنده i-امین IMF است.
از آنجا که هر مؤلفه تجزیه EMD فقط بخشی از ویژگی های دنباله اصلی را شامل می شود ، IMF ساده تر از دنباله اصلی به نظر می رسد. شکل 1 سری زمانی اصلی و اجزای مختلف با ویژگی های توالی مختلف را نشان می دهد. علاوه بر این ، سری زمانی اصلی از ساختار شماره 14 ساختار ساختمانی سه طبقه انتخاب شده است. سیستم جمع آوری شده یک تحریک تصادفی محدود باند را در محدوده 20-150 هرتز که بر روی ساختار سه طبقه عمل می کند ، فراهم می کند. توضیحات مفصلی از یک قاب سه طبقه را می توان در بخش 3 مشاهده کرد.
2. 2واحد مکرر دروازه دو طرفه
شبکه عصبی مکرر (RNN) عمدتاً برای استخراج ویژگی ها از دنباله زمان استفاده می شود. از آنجا که نورون های آن می توانند اطلاعات را نه تنها از سلولهای عصبی دیگر بلکه از خودشان نیز بپذیرند ، RNN دارای شخصیت های به یاد ماندنی و به اشتراک گذاری پارامتر است که در دستیابی به ویژگی های غیرخطی نظارت بر داده ها ، مانند داده های لرزش ، داده های پاسخ ، قدرتمند هستند. با توجه به مشکل ناپدید شدن گرادیان RNN و کمرنگ شدن ضعیف ، بسیاری از محققان حافظه کوتاه مدت (LSTM) را مطالعه کرده اند که می تواند اطلاعات وابستگی بین داده های توالی طولانی و کوتاه را استخراج کند [30].
با توسعه الگوریتم های یادگیری عمیق ، GRU ، به عنوان نوعی از مدل شبکه LSTM ، پارامترهای کمی دارد که می تواند سرعت آموزش دیده مدل را بهبود بخشد و داده های گمشده را با دقت بالا پیش بینی کند [31]. علاوه بر این ، ساختار الگوریتم GRU مشابه LSTM است که از دروازه های به روزرسانی و تنظیم مجدد تشکیل شده است. دروازه بروزرسانی نشان دهنده میزان تأثیر از اطلاعات خروجی لایه نورون پنهان در لحظه قبلی بر روی لایه پنهان در لحظه فعلی است. مقدار بزرگتر دروازه بروزرسانی تأثیر بیشتری را نشان می دهد. بنابراین ، GRU می تواند ویژگی های عصاره دنباله زمانی را به ترتیب از جلو به عقب استخراج کند.
در میان آنها ، دروازه بروزرسانی میزان تأثیر را از اطلاعات خروجی لایه نورون پنهان در لحظه قبلی روی لایه پنهان در لحظه فعلی نشان می دهد. دروازه تنظیم مجدد نشانگر درجه اطلاعات غفلت کننده لایه نورون پنهان در لحظه قبلی است. دروازه تنظیم مجدد بزرگتر نشان می دهد که اطلاعات کمتری مورد غفلت واقع می شوند. ساختار خاص GRU در شکل 2 نشان داده شده است.