یک مهندس دادهی حسابایی این ویژگیهای فنی را دارد:
- آشنایی با الگوریتمهای تحلیل داده و تجربه طراحی و توسعهی سرویسهای کلان داده
- تسلط به زبانهای برنامهنویسی پایتون، جاوا یا اسکالا و همچنین تسلط بر SQL
- آشنایی با ابزارهای اکوسیستم hadoop مانند HDFS، Spark و HBase
- تجربه کار با Apache Airflow ، Kafka و ELK
- توانایی و تجربهی تحلیل، مستندسازی و مدلسازی داده و همچنین نوشتن کد تمیز و قابل نگهداری
- آشنایی با Docker، Git و اصول CI/CD
- تسلط بر پایگاه دادههای رابطهای و غیررابطهای نظیر PostgreSQL ، MongoDB و Clickhouse
داشتن این ویژگیها هم مزیت محسوب میشود:
- آشنایی با معماری نرمافزار، خصوصا معماریهای مقیاسپذیر
- تجربهی پردازش دادههای کلان با Spark ، Flink یا Dask
- آشنایی با فرمتهای مختلف ذخیرهسازی فایل نظیر Parquet ، HDF5 و Feather
- تجربه در ساخت سیستمهای استریم داده با Kafka Streams یا ابزارهای مشابه
- آشنایی با مفاهیم Data Warehouse ، Data Lake ، Data Lakehouse و معماریهای مدرن داده
و البته این ویژگیهای عمومی هم برای هر حسابایی، از نان شب واجبتر است:
- توانایی حل مسئله: میشه گفت که هر داده و پروژه، یک مسئله جدیده که قبلا ندیدیمشون! به همین دلیله که یک حسابایی میتونه به خوبی به مسائل جدید حمله کنه تا اونها رو از پا دربیاره.
- دارای روحیه کار تیمی: توی حسابا این «تیم» هست که پروژهها رو انجام میده و نه «شخص» و نه حتی مجموعهای از «شخصها»! بنابراین توانایی کار کردن با یک تیم، یکی از مهمترین ویژگیهای یک حسابایی هست.
- علاقهمند به یادگیری: در علوم داده هم مثل خیلی از حوزههای فناوری و دانش، ابزارها و دانشها دائما در حال تحول و پیشرفت هستن. به همین دلیل، علاقه به یادگیری فناوریهای جدید یکی از تواناییهای مهم یک حسابایی محسوب میشه که میخواد همیشه با استانداردهای بالا کارهاش رو انجام بده.