Archivo por de la categoria 'Web Semàntica'

Capas de la Web Semántica

Ago 05 2011 Autor: J.P Aulet under Internet,Semantic,Web Semàntica

Las capas de la web semántica (“semantic stack“, en inglés) es una visualización de las diferentes tecnologías usadas para construir la web semántica a modo de capas o pilas según el nivel de abstracción de éstas. Así, en el nivel inferior se situan tecnologías cómo es el protocolo ‘URI’ y en la superior posibles tecnologías futuras para conseguir la web ‘perfecta’. En esta bonita imagen se puede observar esta estructura de capas a nivel lógico (en inglés pero de fácil lectura):

semantic_web_technology_stack

Otra forma de verlo es esta:

Revised_Semantic_Stack

Cómo se ve en las dos imagenes, la Web Semántica reposa sobre varias tecnologias / protocolos / lenguajes. Entre ellas cabe destacar:

- URI: cadena de carácteres que identifica inequívocamente  un recurso (servicio, página, documento, dirección de correo electrónico, enciclopedia, etc.) en Internet.

- Unicode: es un estándar codificación de caracteres diseñado para facilitar el tratamiento informático, transmisión y visualización de textos de múltiples lenguajes y disciplinas técnicas.

- XML: siglas en inglés de eXtensible Markup Language (‘lenguaje de marcas extensible’), es un metalenguje extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C). XML no es realmente un lenguaje en particular, sino una manera de definir lenguajes.

- SPARQL: Se trata de un lenguaje estandarizado para la consulta de grafos RDF.

- RDF: es un framework para metadatos para representar la información en la web desarrollado por el W3C.

- RIF: RIF es un formato para la inferencia mediante Reglas del W3C. Es un lenguaje XML para expresar las reglas que las computadoras pueden ejecutar.

- OWL: es el acrónimo del inglés Ontology Web Language,  para publicar y compartir datos usando ontologías en la WWW. OWL facilita la construcción de un sistema de etiquetas sobre RDF en XML.

Comparado con las primeras versiones del Internet (allà por los años 90), la diferéncia/evolución de la WWW es evidente.

Comments Off

Generación de metadatos semánticos mediante juegos online

1. Introducción: “Games with a Purpose”

La proliferación de la Web está llenando la red con una cantidad ingente de información, lo que comporta la necesidad de empezar a tratar toda esta información para estructurarla y dotarla de sentido semántico. Actualmente se pretende que los ordenadores puedan entender la semántica de la información que hay en la Web y que sea posible integrar diversas fuentes de información independientemente de la procedencia y formato de éstas, haciendo así una Web Semántica.

generacion metadatos semanticos mediante juegos online
Juegos y Web Semántica

Con la utilización de juegos online se podría resolver, o al menos contribuir a resolver, uno de los problemas de la web semántica. El problema a resolver es la anotación de contenidos web y la solución que se propone es aplicar el concepto de ‘Human Computation’ a un juego online, de manera que los jugadores a base de partidas, solucionen el problema planteado.

La web semántica requiere que los contenidos web incorporen una serie de anotaciones que permitan a los ordenadores entender su significado. El proceso de crear estas anotaciones es lo que llamamos la anotación de contenidos, y éste se podría hacer en el momento en que se desarrollan los contenidos. El problema sin embargo, es que actualmente, la mayoría de profesionales del sector no tienen los conocimientos necesarios para hacerlo, y además, hay gran cantidad de contenidos que los generan usuarios que no son profesionales del sector, como son por ejemplo, toda la comunidad de bloggers. Por otro lado, nos topamos también con el hecho de que la gran mayoría de contenidos web actuales no disponen de estas anotaciones. Así pues, la falta de estas anotaciones se ha convertido en un cuello de botella a la hora de hacer realidad la web semántica.

El trabajo de crear estas anotaciones, hoy en día, es una tarea que requiere la intervención humana, y el coste económico que esto supone hace que sea inviable si tenemos en cuenta la gran cantidad de recursos que hay para anotar, y la naturaleza cambiante de los mismos. Es por ello que se hace necesario encontrar métodos de anotación automáticos. Actualmente, parece que la anotación automática mediante juegos online, siguiendo el paradigma “Games with a purpose” (GWAP, Juegos con Propósito) de Luis von Ahn, puede ser una buena solución al problema expuesto. Por un lado los participantes en el juego lo hacen de manera desinteresada, lo que soluciona el problema del coste económico asociado a la anotación manual, y por otro lado, los usuarios potenciales del juego son toda la comunidad de internautas, con lo que el proceso de anotación de toda la web, es factible. Además, no es necesario que los usuarios tengan conocimientos.

1.2 -Ejemplos de juegos:

La forma más facil de ver el funcionamiento de estos tipos de juegos, es ver ejemplos reales ya existentes.Los juegos suelen cumplir todas las características GWAP que se han descrito anteriormente y que podemos resumir con los siguientes puntos:

• Juego online multiusuario
• Se juega por parejas. Las parejas son aleatorias y no se pueden comunicar
• Si un jugador queda suelto juega con una pareja ficticia simulada por sistema.
• Una partida tiene un tiempo limitado durante el cual se juegan tantos turnos de juego como es posible.

Estos juegos son:

1.2.1 – ESP Game (Imagen)

ave
Ejemplo de etiquetaje

(Ahora ImageLabeler) Juego en que cada uno de los jugadores se les presenta un a foto y ambos jugadores deben entrar palabras clave (tags) que describan la foto que están viendo. Cuando hay una coincidencia en el tag entrado por los dos jugadores, éstos reciben puntos y pasan al siguiente turno del juego, donde se les da una nueva foto y se repite el proceso. La partida está limitada por un tiempo máximo de juego, el objetivo es conseguir tantos puntos como sea ​​posible. Además permite recibir más puntos con etiquetas más descriptivas. Por ejemplo, la imagen izquierda puede ser descrita por las etiquetas: cielo (50 puntos), aves (60 puntos), los elevados (120 puntos), o un pájaro fragata (150 puntos). Esta empresa fue comprada por Google, pasando a ser ‘Image Labeler‘, con más funcionalidades, y que les ha permitido etiquetar mejor las busquedas por imágenes (que no sólo se basa en el nombre del archivo, sino también por etiquetas y diferenciar por ejemplo entre casa roja y casa azul).

Web: http://images.google.com/imagelabeler/

1.2.2 – Verbosity (Lenguaje)

El propósito del juego es recoger sentencias que contengan hechos de sentido común, como por ejemplo “las personas tienen dos piernas”. La partida dura un tiempo limitado y funciona por turnos. En vez alternativos asigna el rol de “Descriptor” en uno de los miembros de la pareja al otro el de “adivinador”. En Verbosity se le da una palabra clave y sobre esta debe construir sentencias con hechos de sentido común.La sentencia no puede contener la palabra clave. Entonces, esta sentencia se pasa al Adivinador que debe adivinar de qué palabra clave se trata.

Web: http://www.gwap.com/gwap/gamesPreview/verbosity/

1.2.3 -  Ontogame (Texto y Vídeo)

ontogame
Ontogame

Ontogame es un proyecto de investigación científica que tiene por objetivo la aplicación del paradigma ‘Games With A Purpose’ . Actualmente en su web podemos encontrar varios juegos, entre ellos OntoPronto y OntoTube destinados respectivamente a la anotación de artículos de la Wikipedia y de videos de YouTube.

Web:  http://www.ontogame.org

1.2.4 – LabelMe (Imagen)

Al entrar en la herramienta, una imagen de la base de datos serán seleccionada al azar y se deben anotar tantos objetos como sea posible.

Web: http://labelme.csail.mit.edu/

1.2.5 – Peekaboom (Imagen)

peekaboom
peekaboom

Un juego más en el que son necesarios dos jugadores simultáneos, en el que cada uno tiene un rol diferente, “peek” y “boom”. El jugador “peek” empieza con una pantalla en blanco, mientras que el jugador “boom” visualiza una imagen y una palabra asociada a esta. La finalidad de “boom” es la de revelar partes de la imagen a “peek”, de tal forma que este pueda adivinar la palabra asociada a la imagen. A cada respuesta que da “peek”, “boom” puede indicarle si se acerca o aleja de la respuesta correcta. Cuando “peek” acierta la palabra, ambos jugadores obtienen puntos y se cambian los roles. También si la imagen y la palabra a adivinar, son muy complicadas, ambos jugadores pueden pasar, aunque no obtienen ningún punto.

Web: http://www.peekaboom.org/other_games.html

1.2.6 – TagATune (Música)

Otro juego online para dos jugadores, en este caso la finalidad del juego es la de recolectar etiquetas (tags) musicales de los jugadores. El juego se divide en diferentes rondas, y en cada una suena la parte de una misma canción o partes de diferentes canciones, en la que los jugadores deben añadir tags descriptivos para la canción que está escuchando. Luego se les muestran los tags que han escrito cada uno y han de decidir si estaban o no, escuchando la misma canción.

Web: http://www.gwap.com/gwap/gamesPreview/tagatune/

1.2.7 – Semantic Games (Varios)

SemanticGames.org es un portal de la comunidad que recoge los juegos que tienen como objetivo la creación de contenido semántico sin embargo, estos juegos no son propiedad del consorcio del proyecto ‘Insemtives’. El sitio web debe servir como visión global de los juegos semánticos disponibles en la actualidad en términos de lo que estos juegos se centran en los juegos semánticos dirección de un propósito específico. Tales propósitos son, por ejemplo la anotación de vídeos, imágenes, textos o sitios web de los archivos de audio,la construcción de la ontología y la ontología de la alineación,la creación de conexiones entre las entradas de blog o interconexión de datos.

Web:  http://www.semanticgames.org/

Este es un interesante campo, que puede combinar las posibilidades de dos sectores en franca expansión. Los juegos sociales y la Web Semántica. Estaremos atentos a las nuevas noticias que puedan surgir.

Comments Off

RFID

RFID (Radio Frequency IDentification, en español identificación por radiofrecuencia) es un sistema de almacenamiento y recuperación de datos remoto mediante etiquetas RFID. Estas son unos dispositivos pequeños, similares a una pegatina, que pueden ser adheridas o incorporadas a un producto, un animal o una persona. Contienen antenas para permitirles recibir y responder a peticiones por radiofrecuencia desde un emisor-receptor RFID. Una de las ventajas del uso de radiofrecuencia es que no se requiere visión directa entre emisor y receptor.El propósito fundamental de la tecnología RFID es transmitir la identidad de un objeto (similar a un número de serie único) mediante ondas de radio. Las tecnologías RFID se agrupan dentro de las denominadas Auto ID (automatic identification, o identificación automática) y si tenemos en cuenta la nueva expansión del Internet de los Objetos, esta tecnologia nos ofrece la posibilidad de identificar y conectar a internet casi cualquier tipo de dispositivos.

El RFID puede ser un punto clave para implementar el internet de los objetos y las ciudades inteligentes, al poder medir con sensores todo tipo de parámetros (temperatura, humedad, luminosidad, proximidad,etc.) y transmitirlos a un dispositivo central que identificaría al emisor con su ID única y actuaria en consecuencia (parando la iluminación de la ciudad, los aspersores, creando una alerta de calor/frio automaticamente, etc.).

Chip RFID Pasiva en forma de etiqueta

Chip RFID Pasiva en forma de etiqueta

Los chips RFID pueden ser:

  • Pasivos :  Los tags pasivos no poseen alimentación eléctrica, pueden transmitir a una distáncia de entre 10 cm. y varios metros. Al no usar alimentación, suelen ser de reducido tamaño (usualmente en forma de pegatina).
  • Activos : Usan energia própia, lo que les permite mejorar en fiabilidad, distáncia de transmisión (cientos de metros)  y mejora de qualidad de señal, por el contrario son más caros (entre 20 y 90€), grandes y tienen una vida útil menor (hasta 10 años).  También poseen una capacidad de almacenamiento y interacción mayor, lo que le permite poseer varios sensores (humedad, vibración, luz, radiación, temperatura,componentes atmosféricos…).
  • Semipasivo : Es un hibrido entre las dos tecnologias  anteriores, sumando algunas de las mejores características. Tienen un ratio de vida mayor que las activas, mejor lectura y fiabilidad que los pasivos.  La pequeña bateria funciona para alimentar a el chip y no para transmitir los datos, lo que hace posible almacenar datos.

Redes de Sensores

Uno de los aspectos clave de esta tecnologia es la posibilidad de interconectar varios sensores y crear una red que se controlará mediante antenas que reciben los datos. Así se puede escalar la utilidad de los chips, desde un dispositivo único pasando por controlar calles, barrios y ciudades enteras, obteniendo por ejemplo, gráficos de temperatura por sectores o humedad relativa en parques y jardines.  Y siguiendo con la implementación de los RFID con las nuevas tecnologias de Internet, estos datos en tiempo real se pueden publicar automáticamente en internet, con datos geoposicionados por cada sensor, creando un recurso en tiempo real, geoposicionado, distribuido, público y de alto valor añadido (se pueden reutilizar los datos, crear aplicaciones sobre ellos, etc.).

Así, con esta tecnologia, las administraciones publicas (y por extensión, cualquier empresa o particular) podrian ofrecer datos governamentales (el llamado ogov o administracion abierta) en tiempo real (realtime web, o Internet en tiempo real) a sus ciudadanos de forma gratuita (opendata o datos abiertos)  con dispositivos reales conectados a Internet (Web of the Things o Internet de las cosas) y geoposicionados.

Esta gran combinación de nuevas tecnologias, ofrece una rápida visión del enorme potencial e innovación que supone la implementación de este tipo de redes.

Comments Off

+50 iniciativas de Datos Abiertos

Listado de iniciativas de datos abiertos a nivel mundial ordenados segun su fuente (gobierno de un país, estado, ciudad, organización…). Sólo se incluyen proyectos de 3 o más estrellas según la clasificación de Tim Berners Lee . Si quieres aprender más sobre datos abiertos antes de leer este post, puede hacerlo aquí:

Clasificación:

Publicado 1 estrella

Datos estructurados 2 estrellas

Formatos abiertos 3 estrellas

URI para identificar un dato 4 estrellas

Enlazar con otros datos 5 estrellas

Proyectos Datos Abiertos:

Catalunya:

- Generalitat de Catalunya: http://dadesobertes.gencat.cat

- Ciudades:

Resto de España:

- Comunidades Autónomas:

- Ciudades:

Resto de Europa:

- Centro Europeo de Interoperabilidad Semántica: http://www.semic.eu/semic/view/snav/assetRepository.xhtml

- Inventario de datos abiertos europeos: http://ckan.net/tag/read/eutransparency

- Francia:

- Itália:

- Reino Unido:

- Rusia:

- Suecia:

Resto del Mundo:

- Datos del Banco Mundial: http://developer.worldbank.org

- Datos de las Naciones Unidas: http://www.undata-api.org/

- Austrália:

- Canadá:

- Estados Unidos de América:

- Nueva Zelanda:

- Uruguay:

Otros Enlaces de Interés:

- Proyecto Aporta: http://www.aporta.es/

- Ley 37/2007 sobre la reutilización de la información del sector público: http://www.boe.es/aeboe/consultas/bases_datos/doc.php?id=BOE-A-2007-19814

Vía: CTIC, OpenData BCN y CaldoCasero.

*BONUS: Algunos ejemplos de uso de datos Abiertos:

Comments Off

Introducción a REST – 1

Una Breve Introducción:

REST (Representational State Transfer) es una técnica de desarrollo de software web que se sustenta sobre los estándares del HTTP y URI. Todo recurso (información) debe tener y ser accesible mediante una URI única (recordar que una “URL” es un subconjunto del conjunto “URI“). A partir de éste concepto, usamos los métodos de comunicación web sobre HTTP (GET,PUT, POST y DELETE)  para realizar diferentes acciones predefinidas sobre los recursos (URI’s). Para ello, estos recursos se autodefinen (tipo de fichero, como se mostrará, que hacer con GET/POST…) con tecnologías ya existentes como MIME-types, XML

Principios Básicos:

  1. Todo recurso (información, “cosa”, página…) debe tener una URI única.
  2. Enlazar los recursos entre sí (página siguiente, relacionados, información extra…)
  3. Usar métodos/tecnologías estándares (HTTP,URI,XML,JSON,RDF…)
  4. Múltiples representaciones del mismo recurso (puede servirse como RDF,XML,VCARD,RSS… dependiendo de la solicitud)
  5. Sin Estado

Ejemplo Práctico:

URI GET PUT POST DELETE
http://www.sindikos.com/usuarios/ Listar Usuarios - - -
http://www.sindikos.com/usuarios/user1 Mostrar Usuario 1 Crear Usuario 1 Modificar Usuario 1 Borrar Usuario 1
http://www.sindikos.com/usuarios/user1/mapa Mostrar Mapa Usuario 1 Crear Mapa Usuario 1 NO Borrar Mapa Usuario 1

Cómo se observa, las URI son únicas y deben ser descriptivas.  Al construir una URI, esta debe ser semántica, cómo conseguir eso? Usando las convenciones establecidas:

  • – “/”  : para expresar herencia, por ejemplo: /europa/españa/catalunya.xml
  • - ” , ” : para atributos no ordenados, por ejemplo: /europa/españa/madrid,asturias,murcia.xml
  • - “;” :  para atributos ordenados, por ejemplo: /europa/españa/barcelona/lat=30.3;lng=4.11.xml
  • - “?”:  para modificadores, por ejemplo: /europa/españa?search=”Huelva”

Para finalizar, los recursos no deben tener ‘estado’, es decir, no depender del estado del recurso, sino de la URI que representan. Para entender esto, pongamos el ejemplo de un buscador con paginación activada. Podemos buscar en: www.sindikos.com/search?q=”REST”&num=20 sin haber buscado anteriormente la página de resultados anterior y nos debe responder con la segunda página de resultados y no con un error. La URI en sí contiene toda la información para buscar el recurso, sin preocuparse del estado de dicho recurso. Podemos acceder al nivel 12 de zoom en GoogleMaps sin pasar por el zoom 11 de esa zona.

Esta imagen resume perfectamente esta arquitectura/tecnología:

rest

Comments Off