Web social para profesionales de la información (2008)

Filtrado de la información en la Web: Basado en contenido, colaborativo y social

El filtrado de información, los sistemas de recomendación ya existían antes de que Internet fuese siquiera imaginada. Si nos detenemos en las publicaciones impresas, podemos encontrar infinidad de revistas que sirven de guía crítica de películas que hemos de ver, libros que se nos invita a leer, productos que debemos comprar, lugares que visitar, etc. Así pues, el desarrollo de sistemas de filtrado en la Red son herederos de las publicaciones impresas, ya que los internautas necesitan de estos filtros para poder encararse a la cantidad de información que se genera diariamente en la Red y, de este modo, sobrevivir a la infoxicación.

Existen distintos sistemas para el filtrado de información dependiendo de los intereses de los usuarios. Por un lado, tenemos de los filtros basados en el contenido mediante los cuales el sistema de forma automática trata de recomendar productos que el usuario ya había adquirido o consumido en el pasado comparándolo con su perfil. Mientras que el filtrado colaborativo mostraría al usuario productos que han gustado a usuarios con perfiles similares al suyo y le sugeriría productos que otros ya han adquirido. Finalmente, tendríamos sistemas de filtrado de la información social, que se basaría en la recomendación de informaciones y productos mediante las valoraciones voluntarias y colaborativa por parte de los usuarios que están dados de alta.

El filtrado basado en contenido

De una forma más concreta, dentro del filtrado basado en el contenido, cuando un usuario encuentra interesante un documento o un producto, el sistema puede facilitarle contenidos similares dependiendo de los pesos que se asignan a las palabras que mejor describen el contenido del texto o las características de un producto. El contenido se compararía con los pesos que se guardan dentro del perfil del usuario y se enfrentaría a otros ítems. A este proceso se le conoce como “feedback por relevancia”. Este sistema es puro cuando las recomendaciones se realizan basándose tan sólo en los pesos que se almacenan dentro del perfil del usuario y basándose en las puntuaciones que el usuario ha dado a los distintos contenidos que ha consultado en el pasado.

Desgraciadamente, este sistema tiene sus contraindicaciones. La primera de ellas es que tan sólo ciertos contenidos pueden ser analizados, fundamentalmente, texto. Si tratamos de trasladar esta metodología a fuentes multimedia como vídeo o audio, obviamente la aproximación es mucho más complicada teniendo presente la tecnología que actualmente tenemos disponible. Por otro lado, que el texto se refiera a una temática no tiene porqué utilizar las mismas palabras clave que otro que aborde el mismo problema, por lo que la experiencia del usuario con el sistema puede que no sea del todo cómoda.

Un segundo problema detectado es la superespecialización de ciertos usuarios. Cuando un sistema sólo puede recomendar objetos que ya han sido puntuados previamente, basándose en similares, el usuario se encuentra restringido a precisamente esa tipología de ítems. Y, finalmente, otro de los problemas comunes para este tipo de sistemas es que se exige a los usuarios que puntúen los objetos, por lo que no siempre se obtiene un feedback adecuado, además de que es molesto para los usuarios y no todos están dispuestos a puntuar las informaciones que les son ofrecidas.

Las recomendaciones colaborativas

La propuesta de recomendaciones colaborativas es diferente a las recomendaciones por contenido ya que no se basan tan sólo en lo que un usuario haya podido opinar sobre ciertos contenidos ajustando su perfil a lo que haya indicado, sino que se trata de comparar perfiles de usuarios con gustos similares. De este modo, lo que el sistema compara no son las similitudes en contenido sino entre perfiles de usuarios.

De forma análoga al caso anterior, en un sistema de recomendaciones colaborativas puro no se realizaría el análisis de ningún ítem y tan sólo se realizaría comparaciones entre los perfiles de los usuarios y sus gustos. De esta manera, se evitarían las contraindicaciones antes señaladas para el sistema basado en los contenidos. Con este sistema, podemos tratar con cualquier tipología de contenido, mientras que podemos recibir ítems que no tengan nada que ver con el contenido visto en el pasado.

Sin embargo, este modelo dispone de sus propios problemas. Por ejemplo, si un nuevo ítem aparece en la base de datos no hay manera de ofrecerlo a un usuario hasta que uno de ellos pase a valorarlo o a compararlo con otro. En contraste, si el número de usuarios es pequeño respecto al volumen de la base de datos, entonces puede que el número de valoraciones sea pobre, habiendo vacíos respecto a lo que se tiene disponible dentro de ella. Otro problema que nos encontramos es que si un usuario tiene gustos completamente diferentes al resto de la comunidad, el sistema le ofrecería unas recomendaciones bastante pobres.

Filtrado social de la información

Las anteriores aproximaciones respecto al filtrado de información han sido desarrolladas por tiendas en Internet cuyo objetivo era ofrecer a sus clientes productos relacionados a sus compras anteriores o a los ítems que habían consultado como, por ejemplo, Amazon o Netflix (Una tienda on-line muy popular en EE.UU. destinada al alquiler de DVDs); así como poner en contacto a clientes con gustos similares, además de otro tipo de interactuaciones entre ellos. Sin embargo, de la mano de la Web 2.0, nos llega otro tipo de sistemas de recomendación que se basan en las sugerencias que hace un usuario a sus amistades sobre productos o documentos que encuentra interesantes. Éste sería el caso de Menéame - Aunque el concepto original proviene de Estados Unidos con Digg o Reddit - donde los usuarios recomiendan las historias que consideran interesantes y éstas son valoradas por toda la comunidad promocionándola, situándola más arriba o más abajo en la portada o en las distintas secciones que tiene el sistema configuradas y comentándola según el caso. Hay que señalar que Menéame utiliza pesos para otorgar autoridad a sus usuarios dependiendo de su actividad dentro de la web, como por ejemplo las noticias enviadas, las valoraciones hechas, los comentarios dejados, etc.

Respecto a un sistema mixto de filtrado de información junto a un sistema colaborativo tal y como está descrito anteriormente, tendríamos Reddit que sin embargo no parece capaz de enviar noticias tan interesantes a la comunidad como lo hacen los sistemas puros de filtrado social de la información.

La crítica hacia el filtrado social de la información

Uno de los mayores problemas que se achacan a estos sistemas es que lo más interesante no quiere decir lo más importante. El hecho de que los periódicos comenzasen a incluir sistemas de recomendación dentro de los contenidos de sus webs fue una actitud muy aplaudida por la comunidad pro-Web 2.0, sin embargo los resultados dejaban mucho que desear y algunos consideraron que, en realidad, se trataba de un error garrafal.

Hoy en día, podemos a poco que nos paseemos por los sitios de recomendación de noticias o simplemente por los medios de comunicación que ofrecen secciones tipo “Lo más leído”, “Lo más votado” o “Lo más enviado” nos enteraremos de lo más absurdo, grotesco, extraño o sórdido, pero lamentablemente no sabremos qué está pasando realmente en el mundo.

4 Comentarios