Los tipos de tareas que se pueden encontrar dentro de la extracción de la información son variados. Nosotros nos centraremos en los siguientes cuatro: reconocimiento de entidades, resolución de anáforas, reconocimiento del rol y reconocer relaciones.

1.- Reconocimiento de entidades: es una subtarea de la recuperación de información que busca localizar y clasificar elementos atómicos en texto sobre categorías predefinidas como nombres de personas, organizaciones, localizaciones, expresiones de horas, cantidades, valores monetarios, porcentajes, etc.  Para más información (en inglés) visite la referencia de la Wikipedia al respecto.

2.- Resolución de anáforas: es una subtarea de la recuperación de información que busca reconocer los referentes en en múltiples expresiones. Un ejemplo sería:

Dimos plátanos a los monos porque ellos estaban hambrientos.
Dimos plátanos a los monos porque ellos estaban maduros.

    Mientas que en el primer caso ellos hace referencia a los monos, en el segundo caso hace referencia a los plátanos. Un entendimiento semántico de la situación consistiría en saber que son los monos los que están hambrientos y los plátanos los que pueden estar maduros.

3.-  Reconocimiento del rol: es una subtarea de la recuperación de información que busca reconocer el papel que tiene una persona, objeto o lugar dentro de un texto.

4.- Reconocer relaciones: es una subtarea de la recuperación de información que sirve para identificar relaciones semánticas entre varias entidades de un texto.