Ons H.A.A.I. project

Met de steun van Provincie Oost-Vlaanderen startten Mirto en Lichtwerk het zogenaamde H.A.A.I.-project op (staat voor Human Assisted Artificial Intelligence). Met dit initiatief bieden we binnen de sociale economie een nieuwe innovatieve dienstverlening aan. De bedoeling is daarbij om maatwerkers AI-gerelateerde taken te laten uitvoeren, zoals data-labeling of -annotatie, waarmee modellen voor artificiële intelligentie en machine learning getraind worden. Met deze nieuwe activiteit wil Mirto zich als maatwerkbedrijf stevig inbedden in het snelgroeiende Vlaamse AI-ecosysteem.

Data labeling

Artificiële intelligentie en machine learning domineren het nieuws en deze technologie wordt razendsnel geïmplementeerd in alle domeinen. De technologie is performant als de data die gebruikt wordt kwalitatief en gecontroleerd is. Daar komen vaak mensen aan te pas die allerhande handelingen treffen om kwalitatieve data te bezorgen om de leercurve van deze technologie te ondersteunen. Deze activiteit wordt gemakshalve data labeling genoemd.

  • H.A.A.I. bestaat uit een team van 15 operatoren die een breed gamma aan opdrachten kan uitvoeren.
  • H.A.A.I. is actief in volgende domeinen: visuele labeling, tekst labeling en data verbetering.
Beeld and video labeling

Beeld en video labeling.

Bij beeld- en videogegevens worden annotaties toegevoegd aan objecten, segmenten of kenmerken in afbeeldingen of frames van video's. Dit omvat het tekenen van kaders rond objecten, het markeren van specifieke kenmerken, het segmenteren van afbeeldingen, enz.

Case Tomtom:
Tomtom stelde een dataset ter beschikking. Op satellietfoto’s valideren van concrete informatie zoals is dit een publieke of private weg.

Tekst labeling

Tekst labeling

Het toekennen van labels of categorieën van bvb krantenartikels en die onder te verdelen in sport, weer, binnenland, buitenland. Een mooi voorbeeld hiervan is de testcase voor het 1700 nummer van de Vlaamse overheid. Op dit nummer kan je vraag inspreken en naargelang het thema herkent het systeem de context van je vraag waardoor je wordt door verbonden met de juiste operator. Maar in een bepaald percentage wordt de vraag niet herkend. Deze vragen worden gecapteerd en worden dan manueel gelabeld.

Data verbetering

De kwaliteit van data is primordiaal voor een juiste training van AI en Ml modellen.

Hier enkele voorbeelden

  • Data cleaning: uit een lange lijst data enkel de relevante data filteren of capteren
  • Data matching: wens je verschillende datalijsten met elkaar te vergelijken of samen te voegen zoals verschillende adreslijste
  • Data correctie: Bij tekstherkenning (OCR) loopt niet alles vlekkeloos en moet er ingrepen gebeuren. Voor het ACLVB scant H.A.A.I. post in. Via OCR worden de naam en het adres van de bestemmeling herkend, maar niet altijd. Indien het adres ongekend is op de databank van Bpost wordt het adres door een operator van H.A.A.I. manueel aangepast

Waar maakt H.A.A.I. het verschil?

  • Lokaal, duurzaam en data-veilig!
    Data labeling wordt te vaak uitbesteed aan overzeese bedrijven of via platformwerk. Welke garanties, buiten de prijs, zijn er dan op vlak van ethische duurzaamheid, dataveiligheid, kwaliteit van het werk?
    H.A.A.I. garandeert transparantie op vlak van sociale en maatschappelijke duurzaamheid en focus op kwaliteit door de training van een team operatoren. H.A.A.I. besteedt aandacht aan de veiligheid van de data en geeft de garantie dat de dataset niet voor andere doeleinden zal gebruikt worden. Voorts vereisen sommige opdrachten lokale, geografische, taalkundige of culturele kennis.
  • Flexibel en maatwerk!
    Elke opdracht kan persoonlijk worden besproken. In onderling overleg wordt een modus operandi uitgetekend. Er wordt afgesproken in welke labeling omgeving of platform de opdracht zal worden uitgevoerd en tegen welke termijn.