Clusteren van visueel gelijke documenten
Documenten clusteren/classificeren op basis van tekst klinkt redelijk eenvoudig om daarvoor een algoritme te ontwikkelen. Maar wat doen we met documenten waar niet genoeg tekst uit te halen valt, of waar helemaal geen tekst in voor komt?