El filtrado de información, los sistemas de recomendación ya existÃan antes de que Internet fuese siquiera imaginada. Si nos detenemos en las publicaciones impresas, podemos encontrar infinidad de revistas que sirven de guÃa crÃtica de pelÃculas que hemos de ver, libros que se nos invita a leer, productos que debemos comprar, lugares que visitar, etc. Asà pues, el desarrollo de sistemas de filtrado en la Red son herederos de las publicaciones impresas, ya que los internautas necesitan de estos filtros para poder encararse a la cantidad de información que se genera diariamente en la Red y, de este modo, sobrevivir a la infoxicación.
Existen distintos sistemas para el filtrado de información dependiendo de los intereses de los usuarios. Por un lado, tenemos de los filtros basados en el contenido mediante los cuales el sistema de forma automática trata de recomendar productos que el usuario ya habÃa adquirido o consumido en el pasado comparándolo con su perfil. Mientras que el filtrado colaborativo mostrarÃa al usuario productos que han gustado a usuarios con perfiles similares al suyo y le sugerirÃa productos que otros ya han adquirido. Finalmente, tendrÃamos sistemas de filtrado de la información social, que se basarÃa en la recomendación de informaciones y productos mediante las valoraciones voluntarias y colaborativa por parte de los usuarios que están dados de alta.
El filtrado basado en contenido
De una forma más concreta, dentro del filtrado basado en el contenido, cuando un usuario encuentra interesante un documento o un producto, el sistema puede facilitarle contenidos similares dependiendo de los pesos que se asignan a las palabras que mejor describen el contenido del texto o las caracterÃsticas de un producto. El contenido se compararÃa con los pesos que se guardan dentro del perfil del usuario y se enfrentarÃa a otros Ãtems. A este proceso se le conoce como “feedback por relevancia”. Este sistema es puro cuando las recomendaciones se realizan basándose tan sólo en los pesos que se almacenan dentro del perfil del usuario y basándose en las puntuaciones que el usuario ha dado a los distintos contenidos que ha consultado en el pasado.
Desgraciadamente, este sistema tiene sus contraindicaciones. La primera de ellas es que tan sólo ciertos contenidos pueden ser analizados, fundamentalmente, texto. Si tratamos de trasladar esta metodologÃa a fuentes multimedia como vÃdeo o audio, obviamente la aproximación es mucho más complicada teniendo presente la tecnologÃa que actualmente tenemos disponible. Por otro lado, que el texto se refiera a una temática no tiene porqué utilizar las mismas palabras clave que otro que aborde el mismo problema, por lo que la experiencia del usuario con el sistema puede que no sea del todo cómoda.
Un segundo problema detectado es la superespecialización de ciertos usuarios. Cuando un sistema sólo puede recomendar objetos que ya han sido puntuados previamente, basándose en similares, el usuario se encuentra restringido a precisamente esa tipologÃa de Ãtems. Y, finalmente, otro de los problemas comunes para este tipo de sistemas es que se exige a los usuarios que puntúen los objetos, por lo que no siempre se obtiene un feedback adecuado, además de que es molesto para los usuarios y no todos están dispuestos a puntuar las informaciones que les son ofrecidas.
Las recomendaciones colaborativas
La propuesta de recomendaciones colaborativas es diferente a las recomendaciones por contenido ya que no se basan tan sólo en lo que un usuario haya podido opinar sobre ciertos contenidos ajustando su perfil a lo que haya indicado, sino que se trata de comparar perfiles de usuarios con gustos similares. De este modo, lo que el sistema compara no son las similitudes en contenido sino entre perfiles de usuarios.
De forma análoga al caso anterior, en un sistema de recomendaciones colaborativas puro no se realizarÃa el análisis de ningún Ãtem y tan sólo se realizarÃa comparaciones entre los perfiles de los usuarios y sus gustos. De esta manera, se evitarÃan las contraindicaciones antes señaladas para el sistema basado en los contenidos. Con este sistema, podemos tratar con cualquier tipologÃa de contenido, mientras que podemos recibir Ãtems que no tengan nada que ver con el contenido visto en el pasado.
Sin embargo, este modelo dispone de sus propios problemas. Por ejemplo, si un nuevo Ãtem aparece en la base de datos no hay manera de ofrecerlo a un usuario hasta que uno de ellos pase a valorarlo o a compararlo con otro. En contraste, si el número de usuarios es pequeño respecto al volumen de la base de datos, entonces puede que el número de valoraciones sea pobre, habiendo vacÃos respecto a lo que se tiene disponible dentro de ella. Otro problema que nos encontramos es que si un usuario tiene gustos completamente diferentes al resto de la comunidad, el sistema le ofrecerÃa unas recomendaciones bastante pobres.
Filtrado social de la información
Las anteriores aproximaciones respecto al filtrado de información han sido desarrolladas por tiendas en Internet cuyo objetivo era ofrecer a sus clientes productos relacionados a sus compras anteriores o a los Ãtems que habÃan consultado como, por ejemplo, Amazon o Netflix (Una tienda on-line muy popular en EE.UU. destinada al alquiler de DVDs); asà como poner en contacto a clientes con gustos similares, además de otro tipo de interactuaciones entre ellos. Sin embargo, de la mano de la Web 2.0, nos llega otro tipo de sistemas de recomendación que se basan en las sugerencias que hace un usuario a sus amistades sobre productos o documentos que encuentra interesantes. Éste serÃa el caso de Menéame - Aunque el concepto original proviene de Estados Unidos con Digg o Reddit - donde los usuarios recomiendan las historias que consideran interesantes y éstas son valoradas por toda la comunidad promocionándola, situándola más arriba o más abajo en la portada o en las distintas secciones que tiene el sistema configuradas y comentándola según el caso. Hay que señalar que Menéame utiliza pesos para otorgar autoridad a sus usuarios dependiendo de su actividad dentro de la web, como por ejemplo las noticias enviadas, las valoraciones hechas, los comentarios dejados, etc.
Respecto a un sistema mixto de filtrado de información junto a un sistema colaborativo tal y como está descrito anteriormente, tendrÃamos Reddit que sin embargo no parece capaz de enviar noticias tan interesantes a la comunidad como lo hacen los sistemas puros de filtrado social de la información.
La crÃtica hacia el filtrado social de la información
Uno de los mayores problemas que se achacan a estos sistemas es que lo más interesante no quiere decir lo más importante. El hecho de que los periódicos comenzasen a incluir sistemas de recomendación dentro de los contenidos de sus webs fue una actitud muy aplaudida por la comunidad pro-Web 2.0, sin embargo los resultados dejaban mucho que desear y algunos consideraron que, en realidad, se trataba de un error garrafal.
Hoy en dÃa, podemos a poco que nos paseemos por los sitios de recomendación de noticias o simplemente por los medios de comunicación que ofrecen secciones tipo “Lo más leÃdo”, “Lo más votado” o “Lo más enviado” nos enteraremos de lo más absurdo, grotesco, extraño o sórdido, pero lamentablemente no sabremos qué está pasando realmente en el mundo.





Buen dÃa a todos:
Muy interesante lo que se comenta en el post, en relación a esto tengo 2 opiniones que a continuación les platico:
Creo que lo que se esta reflejando a través de la Web 2.0 es la interacción entre el usuario y el recurso, es decir, se hacen presentes herramientas que anteriormente era imaginable pensar que existirÃan, ya que, con esto pensamos que la Web social es sinónimo de interacción e “Inteligencia” porque toma una actitud la cual me hace pensar que esta interactuando conmigo, es decir, si yo demuestro que me interesa algo especÃfico, la Web me ayuda a buscar y localizar eso que me interesa, de hecho hasta me puede hacer sugerencias de cosas relacionadas a lo que a mi me gusta. esta caracterÃstica es muy acorde a los fines de la Web social (2.0) que es la interacción de los usuarios con la herramienta.
El otro punto que les quiero comentar es que, si trasladamos esto a las unidades de información, y lo aplicamos de la misma manera que se aplica a la Web pero enfocado a los sistemas de información y bases de datos serÃa algo realmente espectacular, imaginense una base de datos que logre identificar el perfil y los intereses temáticos de un usuario, que al momento de hacer su búsqueda y recuperación de información el sistema le dijera al usuario, mira: de lo que estas tratando de buscar y según tu perfil te comento que tengo “esto”, además de “esto” y “esto”, serÃa una especie de documentalista automatizado, lo que vendrÃa a optimizar y a combatir los malos hábitos que algunos usuarios tiene en el uso de este tipo de recursos.
Creo que este tipo de innovaciones son muy importantes, pero mas lo és, el que nosotros como profesionales de la información tengamos la capacidad y la visión de ir adecuándonos a estos cambios e ir enfocándolos a nuestro fin, el cual se resume en apoyar y ayudar a los usuarios a satisfacer las necesidades de información que se les presenten.
Saludos y seguimos por aqui …
Luis Rivera
Hola:
Algo parecido a la interesante propuesta de Luis Roberto es la busqueda personalizada de Google
Un Motor de búsqueda personalizado es una experiencia de búsqueda adaptada, creada con el núcleo de la tecnologÃa de búsqueda de Google, que prioriza o restringe los resultados de búsqueda basados en los sitios web y en las páginas que especifique. Su Motor de búsqueda personalizado se puede adaptar para reflejar su punto de vista o área de especialización.
Lo que dice Luis lo hace Amazon.com cuando buscamos productos. Interesante implementarlo a bibliotecas.
Creo que en eso nosotros, los profesionales de la información, deberÃamos interferir un poco. Si el sistema de recomendaciones crea redes entre documentos “populares”, deberÃamos meter al ruedo aquellos documentos que no han sido consultados, porque como dice Marcos estarÃamos supeditados a lo que nuestros usuarios conocen.