دسته بندی:معرفی ابزار
معرفی ابزار اسپلانک (Splunk)
اسپلانک(Splunk) یک سکوی(پلتفرم) نرمافزاری برای جستجو، تحلیل و مصوررسازی دادههای تولید شده توسط ماشینهاست که از وبسایتها، اپلیکیشنها، سنسورها و دستگاهها داده دریافت میکند.
معرفی ابزار آپاچی کاساندرا (Apache cassandra)
یکی از ابزارهای مطرح عظیم داده در سال 2020 آپاچی کاساندرا بوده که برای مدیریت عظیم داده کاربرد فراوانی داشته و برای کار با دادههای عظیم طراحی شده تا کاربران بتوانند این دادهها را به راحتی و با سرعت بالا دریافت نمایند.
معرفی ابزار KNIME
KNIME که مخفف Konstanz Information Miner است یک ابزار منبع باز می باشد که برای گزارشدهی، ادغام، تحقیق، مدیریت روابط مشتریان، داده کاوی، تجزیه و تحلیل دادهها، استخراج متن و هوش کسب و کار استفاده میشود. این برنامه از سیستم عاملهای لینوکس، OS X و ویندوز پشتیبانی میکند. این ابزار میتواند به عنوان جایگزین مناسبی برای SAS در نظر گرفته شود.
معرفی ابزار Statwing
Statwing ابزاری ساده برای تحلیل دادههای آماری است. این تحلیلگر برای عظیم داده ساخته شده است. رابط مدرن آن تستهای آماری را بطور خودکار انتخاب میکند.
معرفی ابزار آپاچی دریل (Apache Drill)
از ابزار آپاچی دریل برای ورود و تحلیل انواع داده استفاده میشود و برنامهای متن باز بوده که با یک محیط توزیع شده، برای تجزیه و تحلیل عظیمداده کاربرد دارد. در واقع این محصول یک پیادهسازی متن باز از Google Dremel است.
معرفی ابزار آپاچی کاساندرا (Apache Cassandra)
آپاچی کاساندرا یک پایگاه داده برای مدیریت عظیم داده(Big Data) می باشد.
معرفی ابزار Apache zookeeper
آپاچی زوکیپر از ابزارهای عظیم داده(Big Data) برای ذخیره سازی می باشد.ZooKeeper توسط شرکتهایی مانند Rackspace ،Yahoo، Odnoklassniki، Reddit، NetApp SolidFire و eBay و همچنین سیستمهای جستجوی سازمانی منبع باز مانند Solr استفاده میشود.
معرفی ابزار آپاچی ساموا(Apache Samoa)
ساموا ، پلتفرمی جهت استخراج جریان عظیمداده است و مجموعه ای از الگوریتمهای جریان توزیع شده را برای مرسومترین شیوههای دادهکاوی و وظایف یادگیری ماشین مانند طبقهبندی، خوشهبندی و رگرسیون، و همچنین مفاهیم برنامهنویسی برای توسعه الگوریتمهای جدید، را فراهم میکند.
معرفی ابزار: Apache CouchDB
ابزار Apache CouchDB یک پایگاه داده سندی NoSQL منبع باز است که دادهها را در قالبهای اسناد مبتنی بر JSON جمعآوری و ذخیره میکند. برخلاف بانکهای اطلاعاتی رابطهای، CouchDB از یک مدل داده بدون طرحواره (Schema) استفاده میکند، که مدیریت ثبت دادهها را در دستگاههای مختلف محاسباتی، تلفنهای همراه و مرورگرهای وب ساده میکند.
معرفی ابزار: پلتفرم عظیم داده Qubole
این ابزار یک پلتفرم عظیم داده مستقل و همه جانبه است که با توجه به استفاده کاربر، به صورت خودکار مدیریت، فراگیری و بهینهسازی میکند. این ابزار به تیم داده این فرصت را میدهد که به جای مدیریت بستر، روی نتایج کسب و کار متمرکز شوند.
معرفی ابزار Hortonworks Data Platform
پلتفرم داده هورتون ورکس یک توزیع آپاچی هدوپ مبتنی بر معماری متمرکز YARN است که منبع باز، با امنیت بالا و آماده برای سازمانها میباشد. HDP در جهت نیازهای مرتبط با دادههای ذخیره شده و همچنین بر اساس توانمندسازی اپلیکیشنهای بلادرنگ عمل میکند و قدرت تحلیلی ارائه شده توسط آن میتواند تصمیمگیری و نوآوری را شتاب بخشد.
معرفی ابزار آپاچی هایو (Apache Hive)
آپاچی هایو یک پروژۀ نرم افزاری انبار داده است که بر روی ساختار آپاچی هدوپ ایجاد شده و برای خلاصه سازی داده ها، پرس و جو و تجزیه و تحلیل آنها بکار می رود. هایو یک رابط کاربری شبه SQL دارد که برای پرس و جوی داده های ذخیره شده در پایگاه داده ها وفایل سیستم های مختلف بکار می رود.
معرفی ابزار آپاچی کافکا (Apache Kafka)
آپاچی کافکا(Apache Kafka) در ابتدا توسط لینکدین توسعه یافت و در اوایل سال 2011 بصورت نرم افزار متن باز در آمد. در نوامبر ۲۰۱۴ ، چندین مهندس که در لینکدین بر روی کافکا کار میکردند یک شرکت جدید به نام Confluent ایجاد کرده و به صورت انحصاری بر روی توسعه کافکا کار کردند. بر اساس یک پست در سال 2014 به نظر می رسد که جی کربس نام این برنامه را از نام فرانتس کافکا نویسنده آلمانی برداشت کرده است.
معرفی ابزار آپاچی استورم (Apache Storm)
آپاچی استورم یک چارچوب پردازشی توزیعی برای پردازش داده های در جریان می باشد که به زبان برنامه نویسی clojure نوشته شده است. این برنامه در ابتدا توسط ناتان مارتس و همکارانش در موسسه بکتایپ ایجاد شده و بعد از تصاحب آن توسط تویتر به صورت نرم افزاری منبع باز درآمد.
معرفی ابزار آپاچی اسپارک (Apache Spark)
اسپارک یک موتور پردازش داده است که اولین بار در سال 2009 به عنوان یک پروژه در آزمایشگاه ای ام پی دانشگاه کالیفرنیا، برکلی طراحی شد. سپس در سال 2013 به یک پروژه انحصاری از بنیاد نرمافزاری آپاچی تبدیل شده و در اوایل سال 2014 میلادی به یکی از پروژههای برتر بنیاد ارتقا یافت.
معرفی ابزار آپاچی اچ بیس (Apache HBase)
آپاچی HBase یک سیستم مدیریت پایگاه داده ستونی می باشد که بر روی فایل سیستم هدوپ کار می کند.
معرفی ابزار مونگودیبی(MongoDB)
با افزایش میزان دادهها در سراسر جهان، موجی از گرایشها به سوی پایگاههای داده غیررابطهای که اصطلاحا به آنها "NoSQL" میگویند بوجود آمده است. شرکتها و سازمانها به دنبال روشهای جدید برای مدیریت سیلی از دادهها و ابزارها و سیستمهای مدیریت پایگاه داده که جایگزین ومتمایز از سیستمهای پایگاه داده سنتی هستند. در اینجا میخواهیم یکی از این پایگاههای داده به نام مونگو دی بی((MongoDb را توصیف کنیم.
معرفی ابزار آپاچی ماهوت (Apache Mahout)
آپاچی ماهوت ابزار پرکاربرد دیگر اکوسیستم هدوپ، آپاچی ماهوت میباشد. ماهوت واسطهایی برای ایجاد برنامههای مقیاسپذیر یادگیری ماشین را فراهم میکند
معرفی پایگاه داده آپاچی هدوپ (Apache Hadoop)
آپاچی هدوپ یک چارچوب نرم افزاری منبع باز است که برای ذخیرهسازی و پردازش توزیع شده مجموعه دادههای عظیم با استفاده از مدل برنامه ریزی MapReduce استفاده میشود.
سیستم کلاستر محاسباتی با کارایی بالا (HPCC)
این ابزار بر روی یک سکوی واحد، یک معماری واحد و یک زبان برنامهنویسی واحد برای پردازش دادهها ارائه میگردد. بر خلاف هدوپ، مدل دادهای در این ابزار به وسیله کاربر تعریف شده و تضمین میکند که ECL در حداکثر زمان سپری شده انجام میگردد و گرهها به شکل موازی پردازش شوند.
دسته بندی
- معرفی ابزار 27
- مطالعه موردی 27
- کتاب بخوانیم 50
- معرفی کتاب 32
- مرور منابع علمی 35
- اینفوگرافیک 7
- تجربه داخلی 4
- مصاحبه 22
- معرفی کسب و کار داده محور 10
- معرفی سرویس 7