Existen multiples herramientas utilizadas en la extracción de información. Dos de ellas son:
1.- General Architecture for Text Engineering (GATE): es un toolkit de software Java desarrollado originalmente por la universidad de Sheffield en 1995 y ahora utilizado en todo el mundo, siendo la extracción de información una de sus funciones (y cuyo sistema recibe el nombre de ANNIE, A Nearly-New Information Extraction System).
2.- Calais: la forma de funcionar de Calais es la siguiente; usando procesamiento de lenguaje natural y otro tipo de técnicas, este servicio web mira en el texto y localiza las entidades (personas, lugares, productos, etc.), hechos (Juan trabaja para UC3M) y eventos (Juan fue acreditado como profesor titular). A continuación procesa esas entidades, hechos y eventos y los devuelve en formato RDF.