KI-Modus zur Herzinfarktvorhersage lose mit „No-Code“-Tools

Zoomen / Ah, der einfache Knopf!

Oric Lawson | Getty Images

Dies ist die zweite Episode unserer Erforschung des maschinellen Lernens ohne Code. In unserem ersten Artikelhaben wir unsere Problemstellung dargelegt und die Daten besprochen, die wir verwenden werden, um zu testen, ob ein hochautomatisiertes ML-Tool, das für Geschäftsanalysten entwickelt wurde, kostengünstige Ergebnisse nahe der Qualität von liefern kann Codeintensivere Methoden Es beinhaltet ein bisschen von Menschen angetriebene Datenwissenschaft.

Wenn Sie diesen Artikel noch nicht gelesen haben, kommen Sie wenigstens zurück überfliege es. Wenn Sie fertig sind, sehen wir uns an, was wir mit unseren Herzinfarktdaten unter „normalen“ (d. h. den Code-intensivsten) maschinellen Lernbedingungen machen werden, und werfen dann alles weg und drücken die „Einfach“-Taste.

Wie bereits erwähnt, arbeiten wir mit einer Reihe von Daten zur Herzgesundheit, die aus einer Studie der Cleveland Clinic und des Ungarischen Instituts für Kardiologie in Budapest (sowie anderer Orte, deren Daten wir aus Qualitätsgründen verworfen haben) stammen. Alle diese Daten sind in verfügbar Lagerhaus Wir haben es auf GitHub erstellt, aber seine ursprüngliche Form ist Teil von Datenlager Es wurde von der University of California-Irvine für Machine-Learning-Projekte gepflegt. Wir verwenden zwei Versionen des Datensatzes: eine kleinere, vollständigere Version, die aus 303 Patientenakten der Cleveland Clinic besteht, und eine größere Datenbank (597 Patienten), die HGI-Daten enthält, bei der jedoch zwei Arten von Daten aus dem kleineren Datensatz fehlen.

Es sieht so aus, als ob die beiden fehlenden Felder der ungarischen Daten wichtig sein könnten, aber die Daten der Cleveland Clinic selbst könnten für einige ML-Anwendungen zu klein sein, also werden wir versuchen, unsere Grundlagen abzudecken.

der Plan

Da mehrere Datensätze zum Trainieren und Testen zur Verfügung stehen, ist es an der Zeit, mit dem Schleifen zu beginnen. Wenn wir es so machen würden, wie es Datenwissenschaftler normalerweise tun (und wie wir es letztes Jahr versucht haben), würden wir:

Teilen Sie die Daten in eine Trainingsmenge und eine Testmenge auf
Verwenden Sie Trainingsdaten mit einem vorhandenen Algorithmustyp, um das Modell zu erstellen
Überprüfen Sie das Modell mit dem Testset, um seine Genauigkeit zu überprüfen

Wir können dies alles tun, indem wir es im Jupyter-Notebook codieren und das Modell modifizieren, bis wir eine akzeptable Genauigkeit erreichen (wie wir es letztes Jahr in einem fortwährenden Zyklus getan haben). Stattdessen probieren wir zunächst zwei verschiedene Methoden aus:

Ein „No-Code“-Ansatz mit AWS Sagemaker Canvas: Canvas nimmt die Daten als Ganzes, teilt sie automatisch in Training und Test auf und erstellt einen Vorhersagealgorithmus
Ein weiterer „No-/Low-Code“-Ansatz unter Verwendung von Sagemaker Studio Jumpstart und AutoML: AutoML ist ein Großteil dessen, was hinter Canvas steckt; Es wertet die Daten aus und probiert eine Reihe verschiedener Arten von Algorithmen aus, um den besten zu ermitteln

Danach wenden wir eine der vielen kampferprobten maschinellen Lernmethoden an, mit denen Datenwissenschaftler bereits mit diesem Datensatz experimentiert haben, von denen einige eine Genauigkeit von über 90 Prozent beanspruchen.

Das Endprodukt dieser Methoden sollte ein Algorithmus sein, den wir verwenden können, um eine Vorhersageabfrage basierend auf Datenpunkten auszuführen. Aber das eigentliche Ergebnis wird ein Blick auf die Kompromisse für jeden Ansatz in Bezug auf Zeit bis zur Fertigstellung, Genauigkeit und die Kosten der Rechenzeit sein. (In unserem letzten Test hat AutoML selbst praktisch das gesamte AWS-Kontoguthaben gesprengt.)

Johannes Falkenberg

Johannes Falkenberg schreibt für HL-1.tv über aktuelle Nachrichten, Politik, Wirtschaft, Technologie, Sport, Unterhaltung und gesellschaftlich relevante Themen. Sein Fokus liegt auf klarer, verständlicher Berichterstattung und der Aufbereitung nützlicher Informationen für Leserinnen und Leser. Mit einem Blick für aktuelle Entwicklungen und relevante Geschichten liefert er fundierte Beiträge, die informieren, einordnen und den Bezug zum Alltag der Menschen herstellen.

KI-Modus zur Herzinfarktvorhersage lose mit „No-Code“-Tools

der Plan

Samsung verteilt Sicherheitsupdate: Nutzer dieser Galaxy-Smartphones sollten jetzt handeln

Brutalistische Villa am Meer: Chloé Nègre erweckt ein Architekturjuwel der 1960er-Jahre auf Korsika zu neuem Leben

Apple AirPods Max 2 im Test: Evolution statt Revolution bei Premium-Kopfhörern

Gewichtszunahme durch Medikamente: Diese Wirkstoffe können das Körpergewicht beeinflussen

Darmflora im Fokus: Studien zeigen positive Effekte von Joghurt auf Krebsrisiko, Blutdruck und Stoffwechsel

Erst Zahnseide, dann Zähneputzen? Studie spricht für eine klare Reihenfolge bei der Mundhygiene

Samsung verteilt Sicherheitsupdate: Nutzer dieser Galaxy-Smartphones sollten jetzt handeln

der Plan

Schreibe einen Kommentar Antwort abbrechen

Weitere Geschichten

Samsung verteilt Sicherheitsupdate: Nutzer dieser Galaxy-Smartphones sollten jetzt handeln

Brutalistische Villa am Meer: Chloé Nègre erweckt ein Architekturjuwel der 1960er-Jahre auf Korsika zu neuem Leben

Apple AirPods Max 2 im Test: Evolution statt Revolution bei Premium-Kopfhörern

Vielleicht haben Sie Folgendes verpasst:

Gewichtszunahme durch Medikamente: Diese Wirkstoffe können das Körpergewicht beeinflussen

Darmflora im Fokus: Studien zeigen positive Effekte von Joghurt auf Krebsrisiko, Blutdruck und Stoffwechsel

Erst Zahnseide, dann Zähneputzen? Studie spricht für eine klare Reihenfolge bei der Mundhygiene

Samsung verteilt Sicherheitsupdate: Nutzer dieser Galaxy-Smartphones sollten jetzt handeln