Roboflow erweitert Open-Source-Datensätze für bessere Computer-Vision-KI-Modelle

Wir freuen uns, Transform 2022 vom 19. Juli, effektiv vom 20. bis 28. Juli, persönlich zurückzubringen. Schließen Sie sich einem KI- und Datenführer an, um aufschlussreiche Gespräche und spannende Networking-Möglichkeiten zu erhalten. Registrieren Sie sich heute!


Alle Machine-Learning-Bibliotheken und -Projekte sind für Lernen, Training und Betrieb auf Daten angewiesen.

Um Entwicklern zu helfen, einfacher von gekennzeichneten Datensätzen und maschinellen Lernmodellen für Computer Vision zu profitieren, kündigt Roboflow heute im Rahmen der Roboflow Universe-Initiative Erweiterungen für Datensätze und KI-Modelle an. Verfügbare Quell-Repositories. Roboflow behauptet, über 90.000 Datensätze zu verfügen, darunter über 66 Millionen Bilder für den im August 2021 eingeführten Dienst Roboflow Universe.

Roboflow wurde 2019 gegründet und sammelte im September 2021 in einer Serie-A-Runde 20 Millionen US-Dollar ein. Roboflow bietet ein Open-Source-Universum-Repository mit Datensätzen und Modellen für Computer Vision, Datenkennzeichnung, Modellentwicklung und Hosting-Funktionen. Das Geschäftsmodell von Roboflow besteht darin, Benutzern auf Einstiegsebene eine kostenlose Servicehierarchie bereitzustellen und Organisationen, die ihre eigenen Geräte verwenden oder deren Nutzung zunimmt, kostenpflichtige Support- und Serviceoptionen anzubieten.

Roboflow Universe stellt nicht nur Bilder zur Verfügung, die Entwickler verwenden können. Es soll Bilder bereitstellen, die mit einem Ansatz kuratiert wurden, der den Datensatz für KI-gestützte Anwendungen verfügbar macht.

„Ein Projekt umfasst im Grunde sowohl einen Datensatz, den jemand verwenden kann, als auch ein Modell, das mit diesem Datensatz trainiert wird“, sagte Mitbegründer und CEO Joseph Nelson gegenüber VentureBeat. “Datensätze sind sowohl Bilder als auch Anmerkungen.”

Die Daten sind großartig, die beschrifteten Daten sind besser

Laut Nelson verbringen Organisationen in der Regel viel Zeit mit der Vorbereitung von Machine-Learning-Daten.

Der Datenaufbereitungsprozess umfasst die Kennzeichnung und Klassifizierung der Daten, damit das Modell effektiv trainiert werden kann. Laut Nelson ist die Bezeichnung des Roboflow-Universums mehr als nur eine Bildbeschreibung.

Beschriftungen, die Roboflow Universe in einen bestimmten Datensatz aufnehmen kann, sind wie ein Begrenzungsrahmen, der einen Rahmen um das Objekt herum bereitstellt, was hilft, Objekte in überfüllten Landschaften zu erkennen. Eine andere Art der Kennzeichnung, die Roboflow durchführt, ist die Instanzsegmentierung. Es bietet eine polygonale Form, die sauber um das interessierende Objekt herum abgebildet wird.

Auch die beim maschinellen Lernen verwendeten Datenetikettenformate sind oft komplex und vielfältig. Zu diesem Zweck, sagte Nelson, unterstützt Roboflow den Export von Datensätzen in 36 Datenbeschriftungs-Anmerkungsformate. Zu den unterstützten Formaten gehören COCO JSON, VOC XML und YOLODarknet TXT-Formate.

„Bilddaten allgemein zugänglich und verfügbar zu machen bedeutet, dass jemand schnell einen Datensatz finden, ihn in die Trainingspipeline einfügen und loslegen kann“, sagt Nelson.

Wie Entwickler Roboflow Universe-Datensätze in ihre Anwendungen integrieren

Die Einführung von Computer-Vision-Datensätzen und -Modellen in KI-gestützte Anwendungen kann oft eine komplexe Integration sein.

Nelsons Ziel bei Roboflow ist es, die Komplexität zu minimieren. Er sagte, auf den Datensatz des Roboflow-Universums könne über eine offene API zugegriffen werden. Beispielsweise verfügt Roboflow über ein Python-Paket, das auf dem Python Package Index (PyPI) gehostet wird und es Entwicklern ermöglicht, Bilder, Anmerkungen und Modelle programmgesteuert herunterzuladen, um diese Komponenten direkt in ihre Anwendung einzubetten.

Laut Nelson ist die Bereitstellung des Roboflow Universe-Modells für beliebte Cloud-Machine-Learning-Dienste wie AWS Sagemaker und Googles Vertex auch eine einfache Operation über API-Aufrufe. Darüber hinaus stellt Roboflow Datensätze und Modelle als Docker-Container zur Verfügung, sodass sie auf Edge-Geräten bereitgestellt werden können. Es gibt auch ein Software Development Kit (SDK) zur Unterstützung von Apple iOS-Geräten.

„Idealerweise können Ingenieure ihre Zeit darauf konzentrieren, was die Geschäftslogik tatsächlich tut, indem sie das Modell sehr einfach zu verwenden machen, wo immer Sie es möchten“, sagte Nelson.

Die Schnittmenge von Open-Source-Modellen und KI-Voreingenommenheit

Der einfache Zugriff auf Computer-Vision-Datensätze und -Modelle zum Erstellen von Anwendungen ist ein wichtiges Ziel von Roboflow. Eine weitere Auswirkung eines so großen Korpus von Open-Source-Daten trägt dazu bei, Bedenken hinsichtlich der KI-Voreingenommenheit zu zerstreuen.

„KI-Voreingenommenheit ist keineswegs ein gelöstes Problem“, sagte Nelson. “Aber es hilft, Anschaulichkeit, Zugänglichkeit und Auffindbarkeit zu bieten.”

Nelson erklärte, dass KI-Voreingenommenheit oft ein Versuch ist zu verstehen, warum ein Modell eine bestimmte Entscheidung trifft. Grundsätzlich basiert die Art und Weise, wie ein Modell Entscheidungen trifft, auf Daten, mit denen das Modell trainiert wurde. Durch einen größeren Datensatz mit mehr Diversität kann das Modell das Risiko von Verzerrungen verringern und repräsentativer werden.

„Letztendlich sind viele der KI-Voreingenommenheitsprobleme auf Unterschätzung zurückzuführen“, sagt Nelson. “Der Weg, eine Unterschätzung zu beheben, besteht darin, die aktive Sammlung von Datensätzen für unterschätzte Klassen zu ermöglichen und diese Daten zugänglich, durchsuchbar und verfügbar zu machen.”

Venture Beats Mission Es geht darum, ein Digital Town Square für technische Entscheidungsträger zu werden, um sich Wissen über innovative Unternehmenstechnologien und -transaktionen anzueignen. Details zur Mitgliedschaft ansehen.