Kategorie: DataScience
Multiclass Decision Forests basieren auf Decision Trees, also Entscheidungsbäumen, jedoch ohne Abstriche in Bezug auf Flexibilität in Kauf nehmen zu müssen. Decision Forests bieten die gleiche Einfachheit wie auch Entscheidungsbäume, jedoch durch die Kombinationsmöglichkeiten steigert…
Um beim bereits gewählten Beispiel zu bleiben, der Klassifizierung von Druckerproblemen,werden die Wörter Drucker, Toner, bzw. bestimmte Druckermarken in Texten, welche der Klasse Druckerproblem angehören, mit höherer Wahrscheinlichkeit öfter vorkommenals die Worte Tastatur, Bildschirm und…
Das Ziel des Text-Preprocessing ist die Reduzierung der Dimensionalität eines komplexen Textes. Darunter kann man sich die Darstellung der Bestandteile eines Textes, zum Beispiel Sätze als Vektoren im Multidimensionalen Raum vorstellen. [1] Betrachtet man zum…
Topics und Cluster Topics können als Themen verstanden werden, zum Beispiel wenn man an Support Ticketsdenkt, die Ticket-Kategorien und Prioritäten, welche den Support Tickets zugewiesen werden. Oft liegen historische Daten nur in wenigen bereits vorher…
Wenn über künstliche Intelligenz gesprochen wird, werden die Begriffe KI, bzw. das englische Pendant AI, sehr oft synonym verwendet, zusammen mit Schlagworten wieDeep Learning (DL) oder Machine Learning (ML). Es gilt jedoch diese Begriffe voneinander…
Article is in German!
Support Vector Machines (SVMs) offer a practical method for classifying multidimensional data, particularly when it cannot be cleanly separated by setting a threshold. The concept of soft margins and cross-validation is introduced to optimize the ratio of correctly and incorrectly classified data. The text further discusses the concept of hyperplanes and the capability of SVMs to transform low-dimensional data into higher dimensions for better classification. It also highlights the use of Scikit-Learn’s Polynomial-Kernel and Radial-Kernel functions for calculating support vectors in n-dimensional space.