

بزرگنمایی / آه، دکمه آسان! (اعتبار: Aurich Lawson | Getty Images)
این دومین قسمت از کاوش ما در زمینه یادگیری ماشینی بدون کد است. در اولین مقاله خود، مجموعه مشکلات را ارائه کردیم و داده هایی را که برای آزمایش اینکه آیا یک ابزار یادگیری ماشین بسیار خودکار طراحی شده برای تحلیلگران کسب و کار می تواند نتایج مقرون به صرفه و نزدیک به کیفیت روش های فشرده تر را که افراد کمی بیشتری را شامل می شود، ارائه دهد، مورد بحث قرار دادیم. علم داده
اگر این مقاله را نخوانده اید، باید به عقب برگردید و حداقل یک نگاه سریع به آن بیندازید. اگر آماده هستید، بیایید بررسی کنیم که با دادههای حمله قلبی تحت شرایط یادگیری ماشینی «عادی» (یعنی با کد فشردهتر) چه کار میکنیم، و سپس همه آنها را دور بریزیم و دکمه «آسان» را فشار دهیم.
همانطور که قبلاً بحث کردیم، ما در حال کار با مجموعه داده های سلامت قلب هستیم که از یک مطالعه در کلینیک کلیولند و موسسه قلب و عروق مجارستانی در بوداپست (و همچنین سایت های دیگری که به دلایل کیفی داده های آنها را رد کردیم) استخراج شده است. همه این دادهها در مخزنی که ما در GitHub ایجاد کردهایم موجود است، اما شکل اصلی آن بخشی از یک مخزن داده است که برای پروژههای یادگیری ماشین توسط دانشگاه کالیفرنیا-ایروین نگهداری میشود. ما از دو نسخه از مجموعه داده استفاده می کنیم: نسخه کوچکتر و کاملتر، شامل 303 پرونده بیمار از کلینیک کلیولند، و یک پایگاه داده بزرگتر (597 بیمار) که شامل داده های مؤسسه مجارستانی است، اما دو مورد از نوع آنها وجود ندارد. داده از مجموعه کوچکتر
38 پاراگراف باقی مانده را بخوانید | نظرات