خدمات سئو سایت
مونته کارلو، موناکو – 11 مه: مهندسان DS TECHEETAH برای مسابقه روی شبکه در طول … [+] جایزه الکترونیکی موناکو در مونت کارلو در 11 مه 2019 در مونت کارلو، موناکو آماده می شوند. (عکس از سام بلوکسام/تصاویر LAT)
LAT Images مهندس مهندسان داده. بدیهی است که دارند، سرنخ در نام است. اما یک مهندس داده واقعاً به عنوان بخشی از روال روزانه خود چه می کند و چگونه بر ما به عنوان کاربران برنامه های کاربردی نرم افزار سازمانی و خدمات داده امروزی تأثیر می گذارد؟ با توجه به اینکه همه توسعه دهندگان نرم افزار (معروف به برنامه نویسان) لزوماً خود را به عنوان مهندس داده طبقه بندی نمی کنند، چگونه این دو رشته با هم تفاوت دارند و در عین حال هنوز هم به اندازه کافی برای ایجاد یک پیوند همزیستی مثبت وجود دارند؟
از آنجایی که نظرات در مورد این موضوع اکنون در حال افزایش است، باید در نظر بگیریم که چه تعداد از مهندسان نرم افزار خود را مهندس داده می دانند و مهمتر از همه، باید بدانیم که مهارت ها و شایستگی های آنها در این زمینه تا چه حد است. اگر این کد «خط فرمان» نباشد که توسعه‌دهندگان دوست دارند انگشتان خود را در آن فرو کنند، مهندسان داده چه نوع فناوری‌هایی را به دست می‌آورند؟ آیا مهندسی داده به طور فزاینده ای مبتنی بر هوش مصنوعی خواهد شد و آیا این نقش در نتیجه تغییر خواهد کرد؟
این بسیاری از سوالات مهندسی داده است، بنابراین بیایید با یک سوال آسان شروع کنیم.
یک مهندس داده چیست؟ «این واقعاً یک تعریف متحرک است، زیرا نقش خود مهندس داده در حال تغییر است. هنگامی که ما شروع به انتقال علم داده و مهندسی داده به دنیای ارائه برنامه‌های کاربردی می‌کنیم، فوراً به متخصصان تجاری و متخصصان «تکنولوژی» (یعنی متخصصان امنیتی، متخصصان عملکرد، متخصصان اشکال‌زدایی) نیاز داریم که همه با هم در یک تیم بین رشته‌ای متحد کار کنند. ”
Reitbauer واقع‌بین است و می‌گوید که، واقعاً، ما هنوز با مهندسی داده‌ها به آنجا نرسیده‌ایم و مهارت‌ها در بسیاری از جوامع توسعه‌دهنده وجود ندارد، که ممکن است بخشی از این باشد که چرا ایده این تیم‌های کاری ترکیبی جدید تأیید شده است. او می گوید که از داخل Dynatrace (شرکتی که به طور سنتی برای خدمات مدیریت عملکرد برنامه های کاربردی ابری شناخته می شود)، مشتریان در حال عملیاتی سازی و تثبیت شیوه اجرای بارهای کاری داده های خود هستند. این بدان معناست که تیم‌های مهندسی داده‌ها باید شیوه‌های عملیاتی مدرن جدیدی مانند طرز فکر مهندسی قابلیت اطمینان سایت و عملیات‌هایی را که افراد باید مدیریت نوع جدیدی از حجم کاری فشرده داده را یاد بگیرند، اتخاذ کنند. به نظر می رسد Kubernetes به پلت فرم تثبیت این تلاش تبدیل شود.
بیشتر برای شما جدید Galaxy S25 Ultra Teases برنامه های جاه طلبانه سامسونگ از فصل 3، اپیزود 1 بررسی: بازگشتی وحشتناک به وحشتناک ترین نمایش در TVRaiders، آنتونیو پیرس نکاتی در مورد تغییرات فهرستی پس از از دست دادن تحقیرآمیز. برای ایجاد سرویس‌های هوش مصنوعی که به مردم نشان می‌دهد چگونه فیلتر یک جاروبرقی را تغییر دهند (برای مثال بسیار تصادفی). تمام آن داده‌های تصویری و ویدیویی باید دیجیتالی شده و از طریق برخی تکنیک‌های مهندسی داده نسبتاً پیچیده جمع‌آوری شوند. این مهارت ها به عنوان بخشی از برنامه درسی نرم افزار در دانشگاه ها تدریس نمی شوند و به ندرت در دنیای واقعی وجود دارند. ما باید از هم‌اکنون برنامه‌ریزی را برای موارد استفاده از برنامه‌های مهندسی داده در فردا شروع کنیم، قبل از اینکه اتفاق بیفتد.
این یک موضوع فوق‌العاده روان در محافل فناوری اطلاعات است، یعنی برخی از مهندسان داده تنها زمانی احساس راحتی می‌کنند که بتوانند خود را مهندس جریان داده بنامند، زیرا آنها با فناوری‌های پخش بلادرنگ مانند آپاچی کافکا کار می‌کنند. اینجا باید با دقت قدم برداریم.
خطوط لوله داده های تولید «مهندسین داده به دو دلیل اصلی برای موفقیت تیم های علم داده و هوش مصنوعی حیاتی هستند. در مرحله اول، آنها خطوط لوله داده را ایجاد می کنند که داده های آموزشی و آزمایشی را فراهم می کند که دانشمندان داده برای انجام تجزیه و تحلیل، ساخت مدل های ML و طراحی داده ها، محصولات ML و AI استفاده می کنند. ثانیاً، آنها خطوط لوله داده‌های تولید را می‌سازند که مدل‌های تولید را تغذیه می‌کنند و خطوط لوله ML/AI که دانشمندان داده و مهندسان ML می‌سازند، می‌سازند.
کارلسون به ما یادآوری می‌کند که در عمل، همه دانشمندان داده به مهارت‌های مهندسی داده‌های خوب نیاز دارند، زیرا دائماً نیاز دارند به داده‌های اضافی دسترسی داشته باشند، خطوط لوله داده‌ای را که به آنها دسترسی دارند ایجاد کنند و ویژگی‌های جدیدی از این داده‌ها ایجاد کنند. گاهی اوقات آنها نیاز به ساخت خطوط لوله داده تولید را نیز پیدا می کنند، اگرچه او موافق است که این یک روش توصیه شده نیست زیرا مهندسان متخصص داده معمولاً خطوط لوله کارآمدتر و قوی تر می سازند.
دکتر کارلسون از Domino گفت: «بهترین سازمان‌ها مهندسان داده را در تیم‌های علم داده و هوش مصنوعی خود تعبیه می‌کنند تا همکاری مستمر در طول فرآیند توسعه مدل را ساده‌تر کنند و با انجام این کار، زمان بیشتری را برای ارزش‌گذاری، عملکرد بهتر و قوی‌تر برنامه‌های ML و AI دریافت کنند». با ظهور هوش مصنوعی مولد، بسیاری از ناظران و رهبران کسب‌وکار به اشتباه تصور می‌کردند که علم داده و تخصص هوش مصنوعی دیگر ضروری نیست و مهندسان داده، مهندسان نرم‌افزار همه آن چیزی هستند که برای ساخت برنامه‌های هوش مصنوعی لازم است. متأسفانه، این کمک بزرگی به انبوهی از اثبات پروژه‌های مفهومی است که موفق به تولید نشدند و ناامیدی فزاینده از هوش مصنوعی مولد به‌عنوان یک فناوری دگرگون‌کننده.»
مهندسی داده موفقیت‌آمیز برای موارد استفاده از هوش مصنوعی مولد سازمانی در خدمات مشتری، فناوری و داروسازی زیستی و مهارت‌های تخصصی ML و AI می‌تواند سرنخ‌هایی را در مورد مهارت‌های مهندسی داده مورد نیاز امروز در اختیار ما قرار دهد. ما به متخصصان داده نیاز داریم که بتوانند یک مشکل کسب و کار را درک کنند، آن را تجزیه کنند تا با استفاده از روش‌های ML و AI قابل حل باشد، طراحی و توسعه مکرر، آزمایش و اعتبارسنجی راه‌حلی متناسب با نیاز کسب‌وکار و ایجاد یک خط لوله قوی ML/AI که یک خط لوله قوی را ایجاد کند. طیف وسیعی از اجزای فناوری هوش مصنوعی جدید
«اینها مهارت‌هایی نیستند که مهندسان داده (یا توسعه‌دهندگان) در آن آموزش دیده‌اند، و نه فرصتی برای کسب این مهارت‌ها به عنوان بخشی از نقش‌های عادی خود دارند. با این حال، مهندسان داده اغلب پیش نیازهای عالی برای تبدیل شدن به دانشمندان داده موفق، مهندسان ML و نقش جدید “مهندس AI” دارند، فقط به آموزش، فرصت و تجربه بیشتری نیاز دارد.
جان رز، مدیر ارشد فناوری جهانی و مدیر ارشد هوش مصنوعی در Dell Technologies می گوید که هر آرزوی هوش مصنوعی به مهندسی داده نیاز دارد، زیرا بدون پایه مدرن داده، نتایج هوش مصنوعی که ما می خواهیم هرگز محقق نمی شوند. او به ما یادآوری می‌کند که محیط‌های داده مدرن دیگر با اجزای منفرد مانند پایگاه‌های داده، سیستم‌های استخراج-تبدیل-بارگذاری ETL، ابزارهای تحلیلی و غیره تعریف نمی‌شوند. در عوض، سیستم‌های داده مدرن مجموعه‌ای از فناوری‌های متصل هستند که مسیرهایی را بین منابع داده – حسگرها ایجاد می‌کنند. ، برنامه ها، سیستم های تله متری، پورتال های مشتری – و سیستم هایی که می توانند ارزش را از آن داده ها استخراج و استخراج کنند، از جمله چت ربات های هوش مصنوعی، ابزارهای تحلیلی هوش مصنوعی، ابزارهای داده های بزرگ و سیستم های عامل.
با این حال، این سیستم های داده مدرن در مورد ایجاد ارتباط بین مجموعه های منفرد از داده ها و ابزارهای واحد برای استفاده از آن داده ها نیستند. در عوض، سیستم‌های داده مدرن یک پارچه یا مش ایجاد می‌کنند که به این ابزارهای مدرن اجازه می‌دهد به داده‌ها از طیف وسیعی از منابع دسترسی داشته باشند و بینش‌های ترکیبی واقعی ایجاد کنند. به مدل‌های هوش مصنوعی فکر کنید که می‌توانند محتوا را در بسیاری از منابع سازمان‌دهی کنند، هوش مصنوعی‌هایی که می‌توانند کل فرآیند فروش را درک و بهینه کنند و هوش مصنوعی‌هایی که می‌توانند کل تجربه مشتری را از خرید تا خدمات درک کنند و با آن درگیر شوند. امروز و در آینده، مهندسی داده مهارتی است که این سیستم داده مدرن را تعریف، اجرا و راه‌اندازی می‌کند.»
طبق یکی از سؤالات اصلی ما که در ابتدا در اینجا مطرح شد، آیا رز احساس می کند مهندسی داده به طور فزاینده ای مبتنی بر هوش مصنوعی خواهد شد و آیا در نتیجه نقش تغییر خواهد کرد؟
«بله! یک شرکت مدرن امروزی می‌تواند از پتابایت تا اگزابایت تا حتی زتابایت داده‌های داخلی در همه منابع داشته باشد (این مقدار چندین برابر بیشتر از داده‌هایی است که برای آموزش بزرگترین LLM‌های امروزی استفاده می‌شود). استفاده از هوش مصنوعی در آن شرکت مدرن به اکوسیستم داده‌ای آنقدر بزرگ و پیچیده می‌خورد که درک یا کار دستی برای هر انسانی غیرممکن است. به همین دلیل، تنها راه برای موفقیت مهندسی داده مدرن، استفاده تهاجمی از ابزارها و سیستم‌های هوش مصنوعی برای افزایش تلاش‌های انسانی مورد نیاز است. با این حال، ما باور نداریم که ابزار کمک خلبان اولیه (ابزارهایی که انسان را در انجام یک کار تقویت می‌کند) کافی باشد.»
او بر نحوه حرکت کارها تاکید می کند و می گوید که خوشبختانه اکنون در حال ورود به عصر عوامل مستقل هوش مصنوعی هستیم، بنابراین مسیر اجتناب ناپذیر این است که مهندس داده های انسانی کمتر انجام دهنده وظایف و بیشتر به یک سازمان دهنده عوامل مستقل تبدیل شود. که می تواند کار را انجام دهد. رز از ما می‌خواهد یک مهندس داده انسانی را تصور کنیم که اهداف و دستورالعمل‌های یک استراتژی داده را تعیین می‌کند اما سپس کار در برنامه‌ریزی، معماری، پیاده‌سازی و حتی عملیات را به عوامل تخصصی هوش مصنوعی واگذار می‌کند که این وظایف را به طور جمعی اجرا می‌کنند.
زمانی که آنها کار می کنند، انسان در این حلقه است تا مطمئن شود که گیر نمی کند، با اهداف تجاری هماهنگ است و در صورت نیاز به تلاش های جدید، می توان آن کار را تعریف کرد و به عوامل مناسب واگذار کرد. این ایده از عواملی که برای مهندس داده کار می کنند و با آن ها کار می کنند، مسیری را به ما می دهد تا در سیستم های داده در مقیاس پتابایت، اگزابایت یا حتی زتابایت کار کنیم. با توجه به این، نقش مهندسی داده تبدیل به یک متخصص در معماری داده‌های مدرن و رهبر تیم‌هایی از انسان به‌علاوه عوامل مستقلی می‌شود که کار مورد نیاز برای ارائه نتایج داده‌های مدرن در عصر هوش مصنوعی را انجام می‌دهند.»
نظرسنجی ما گفت: از آنجایی که این بحث ادامه دارد، گسترش می‌یابد و محکم می‌شود، (در زمان نگارش مقاله) برای فروشندگان فناوری غیرمعمول نیست که در طول جلسات اصلی کنفرانس سالانه نظرسنجی‌های زنده با کد QR برگزار کنند و از شرکت‌کنندگان بپرسند که چه تعداد از جمع‌آوری‌شده به عنوان داده شناسایی می‌شوند. مهندسان امروز
این تعداد مرتباً در حال افزایش است، اما اکثر کسانی که بله می‌گویند احتمالاً می‌گویند که اساساً در وهله اول حرفه‌ای توسعه نرم‌افزار هستند. از آنجایی که این نقش خود را تثبیت می کند و به طور دقیق تر مدون می شود، شاید بتوانیم به نظرات اساساً کاملاً روانی که در پایان دهه جاری اینجا ارائه شده است نگاه کنیم و ببینیم که چقدر پیشرفت کرده ایم.
ردیفی از ربات های شخصی Topo، در مرکز مونتاژ آنها در کالیفرنیا. (عکس از راجر … [+] Ressmeyer/Corbis/VCG از طریق گتی ایماژ)
Corbis/VCG از طریق Getty Images مرا در توییتر یا لینکدین دنبال کنید. Adrian BridgwaterFollowing من یک روزنامه نگار فناوری با سه دهه تجربه مطبوعاتی هستم. در درجه اول من به عنوان یک نویسنده تحلیل خبری کار می کنم که به توسعه برنامه نرم افزاری “بیت” اختصاص دارد. من بخش زیادی از بیست سال گذشته را صرف تمرکز بر منبع باز، تجزیه و تحلیل و علم داده، محاسبات ابری، دستگاه های تلفن همراه و مدیریت داده ها کرده ام. من سابقه گسترده ای در ارتباطات دارم که از رسانه های چاپی، روزنامه ها و همچنین تلویزیون شروع می شود. در هر صورت، این به من ساعت‌های کافی تجربه خسته‌کننده بدبینانه می‌دهد تا چرخش را از ماده جدا کنم، حتی زمانی که محصولات براق و جدید هستند.”>

* استانداردهای تحریریه چاپ
* چاپ مجدد و مجوزها

توسط chehrenet