Nytt kategoriseringsverktøy fra Xerox
En feilplassert bok i et bibliotek kan fort bli mistet for alltid. Det samme gjelder for dokumenter som ikke har blitt kategorisert riktig. Vår nye programvare kan spare tid og penger og øke produktiviteten ved å sikre at dokumentet er korrekt klassifisert for senere gjenfinning, sier Eric Gaussier, forsker ved XRCE.
Forstår mer enn andre verktøy
Eksisterende kategoriseringsverktøy på markedet håndterer hver type kategori uavhengig av hverandre og er betraktet som ”flat”. Selv om det et er åpenbart for mennesker at biokjemi og biofysikk er relaterte informasjonskategorier, vil for eksempel ikke et flatt kategoriseringssystem oppfatte denne relasjonen.
Det nye Xerox-systemet skal derimot være i stand til å forstå forholdet mellom kategoriene. Derfor skal også programvaren kunne gjennomføre en bedre klassifisering av et dokument.
I følge evalueringer fra pilottester for programvaren finner man igjen det riktige dokumentet oftere og raskere fordi den nye teknologien forstår forholdet mellom dokumenter og kategorier.
Anne-Lise Veuthey, seniorforsker ved Swiss Institute of Bioinformatics, som er en akademisk non-profit organisasjon som forsker og utvikler teknologi for biologi, deltok i pilotprogrammet. –
Vi fant ut at programmet var særdeles nøyaktig til å identifisere dokumenter som inneholdt spesifikk informasjon som var nødvendig for å gjennomføre forskning på menneskelige gener, sier Veuthey.
Teknologiske framskritt
Ifølge Xerox gjør følgende tre integrerte funksjoner kategoriseringsteknologien unik:
• Systemet starter umiddelbart. Ved å bruke avanserte læringsteknikker, med bare noen få eksempler lærer systemet selv hvordan det hierarkisk skal klassifisere dokumentet i eksisterende kategorier.
• Brukervenneligheten er stor og hjelper mennesker på en helhetlig måte å endre uorganiserte elektroniske dokumenter til en ryddig organisert dokumentsamling.
• Systemet kan lære helt nye kategorier på egenhånd. Teknologien finner nye eller voksende temaer og foreslår forløpende nye kategorier for brukeren.
Dirigerer dokumentet riktig
Xerox’ kategoriseringssystem skal kunne håndtere dokumenter skrevet på opp til 20 språk og skal lett kunne tilpasses spesifikke kundebehov. Programvaren sender på en intelligent måte dokumentet til den rette personen på bakgrunn av en forhåndsdefinert brukerprofil.
Dette kan for eksempel bli brukt til å dirigere innkommende e-post til den personen som er ansvarlig for et gitt tema. Dermed elimineres e-post i innboksen som ikke er relevant.
Eksempel på dette kan være kundeklager som dirigeres til rett supportmedarbeider, sier Gaussier. Kategoriseringsteknologien var utviklet med XRCE-forskere basert på deres store ekspertise i lingvistiske analyser og teknikker for maskinlæring.
Programvaren er skrevet i Java og kan brukes på mange plattformer inkludert UNIX, Linux og Windows.
Selskapet forventer at teknologien blir lisensiert til programvareselskaper eller organisasjoner som vil inkorporere det i eget dokumentsystem, for eksempel CRM, informasjons- og datahåndtering.
Xerox Corporation har forsknings og teknologisentre i USA, Canada og Europa, som arbeider innen fargeforskning, dataprosessering, digital bildebehandling, arbeidsmetodikk, elektromekaniske systemer, nye materialer og andre disipliner relatert til Xerox’ ekspertise innenfor printing og dokumenthåndtering.
Selskapet bygger oppfinnelsene inn i forretningsvirksomheten ved å inkludere de i Xerox-produkter og -løsninger, som grunnlag for nye forretningsområder, lisensiering eller ved å selge de til andre enheter.