Data Analysis In Edge-Side
در این نوشته میخواهم بصورت اجمالی درمورد سرنوشت داده ای که از سنسور خارج می شود صحبت کنم. اینکه داده پس از جذب توسط حسگرها وانتقال دقیقا چه مراحلی را طی می کند؟! در واقع باید روشن شود که مفهوم تحلیل داده ها در لبه شبکه ؛ یعنی چه.
در مطلبی که اینترنت اشیای صنعتی را به گفتگو نشستیم، در باره تحلیل داده های کلان تولید شده از سنسورهای بیشمار کارخانه ها، سیلوها ، طرح های شهری وبین شهری و….گفتیم و اشاره کردیم که حجم داده تولیدی در کسری از ثانیه به اوج خود می رسد بنابراین چالش هایی در مدیریت این داده ها وجود دارد. چالش های ذخیره سازی، پردازش، تحلیل و آنالیز و حتی چالش انتقال به سمت سرور و اگر عمیق تر فکر کنیم ، چالش اعتمادسازی و حفظ یکپارچگی داده ها!
مثالی از تحلیل داده در لبه و ابر
پروژه سنجش آب و هوای منطقه ای را درنظر بگیرید. سنسورهایی در مکان های مهندسی شده قرار گرفته اند. بورد این سنسورها جهت جذب اطلاعاتی از قبیل دما و فشار هوا، میزان سرعت باد و میزان رطوبت هوا در فواصل زمانی مشخص برنامه نویسی شده اند . سنسور دیتا(Data) را گرفته و براساس آدرس آی پی(IP Address) سرور که در آن نگاشت شده است، از طریق کانال ارتباطی بی سیم (Wireless)به اولین ایستگاه پایه ارسال می شوند. سپس طبق مسیری که برایش تعریف شده است به سمت سرور فوروارد(Forward) می شود. در سرور API جهت دریافت داده تعریف شده است که آنها را ذخیره و پردازش میکند(البته بر اساس نوع پروژه و فریمورک موجود، این عملیات می تواند برعکس هم باشد یعنی ابتدا پردازش و سپس ذخیره) .
این مراحل کلی برای اینترنت اشیا (IoT) صدق می کند و زمانی که صحبت داده های کلان (Big Data) در حوزه اینترنت اشیای صنعتی (IIoT)می شود این مراحل کمی پیچیده می شوند چرا که در پروژه ای با حجم زیادی از داده Real Time ، حمل و نقل این داده ها از هر نظر حاپز اهمیت می شود. امنیت، سرعت، محل ذخیره سازی، الگوریتم های پردازشی، الگوریتم ها و متدهای تحلیل و…ده ها فاکتور مهم دیگر باید بررسی گردد.در ادامه به بررسی بیشتر این موضوع می پردازیم.
مشکلات احتمالی تحلیل داده در سمت ابر
در کاربردهای بی درنگ(Real Time) دیتا بلافاصه پس از تولید باید مورد پردازش قراربگیرد. و سپس از نتایج حاصله باید رویدادی رخ دهد. مشکلاتی احتمالی ولی غیرقابل انکار از قبیل : سرعت پردازش- تاخیر در زمان ارسال،تاخیر زمان پردازش، از دست رفتن داده در فرایند، ذخیره سازی امن،صحت داده ها وغیره. محققین برای حل این چنین مشکلاتی راهکارهایی ارایه میدهند. مثلا برای اینکه تاخیر در پردازش که در سمت سرور(Cloud) روی می دهد( وآن را محاسبات ابری یا همان Cloud Computingمی نامیم) کاهش پیدا کند؛ بهتر است داده به بخش هایی تقسیم شده و سپس ارسال گرد.
برای حل مشکل از بین رفتن احتمالی داده در زمان ارسال ۲ راهکار وجود دارد اولی کم کردن فاصله بین گره حسگر و سرور و دومی افزایش تعداد سرورهای پردازش داده ها (Replication)و نزدیک کردن آنها به محل جذب دیتا! و بدین صورت بعد از مدتی به این مهم دست پیدا کردند که می توان بخشی از محاسبات مربوط به داده های دستگاه ها و سنسورها را در فضایی بین گره های حسگر و سرورها انجام داد و آن را محاسبات لبه(Edge Computing) نامیدند.
بدین ترتیب بخشی از فرایند پردازشی داده از هر نوع و پروژه ای در سمتی غیر از سمت کاربر و سرور انجام می گیرد که مسلما فوایدی ماننند افزایش سرعت پردازش وکاهش ترافیک ورودی در سمت ابر اشاره کرد و از طرفی هم امنیت داده های معلق بین کاربر و سرور و منتظر پردازش(از هر نوعی) می تواند به خطر بیفتد و اعمال پروتکل های امنیتی روی آن ها از واجبات است. در مطالب بعدی این موضوع را بیشتر مورد کنکاش قرار خواهیم داد. لطفا با ما در ارتباط باشید.