Iniciar sesión | Registrarse | ¿Por qué registrarse?
  • Podrás comentar las noticias con el nombre que elijas
  • Podrás subir tus noticias en soitu.es y guardarlas en tu propia página

Acceso mediante API al etiquetado

Por RAÚL RIVERO (SOITU.ES) *
Actualizado 28-10-2008 16:40 CET

A principios de este mes liberábamos el acceso a nuestra herramienta de etiquetado y prometíamos un API en breve. Aquí está :).

Sinceramente, no es que la salida en JSON o XML no estuviese preparada desde el principio, por supuesto que lo estaba (aunque sólo fuera para poder usarla desde nuestros editores). El problema estaba en que debíamos preparar el resto de nuestro chiringuito para que, además de la clave que ya tenéis para autenticaros ante el sistema, todos vosotros tuvierais una clave pública y otra privada (llamémoslas así aunque estrictamente no lo son, pero eso es harina de otro costal). Todo eso ya está, así que es el momento de dar acceso al etiquetado a través de API.

Dos formatos de salida

Dependiendo de los gustos, manías o, quién sabe, tecnología, dos posibles formatos de salida (además del ya conocido html):

json: con una salida accesible desde cualquier JavaScript con el siguiente aspecto

{     "elements":10,     "tags":[         {             "name":"política",             "weight":"79.57"         },{             "name":"zapatero",             "weight":"61.917"          },{             "name":"vídeos",             "weight":"53.083"         },{              "name":"gobierno",             "weight":"35.361"         },{             "name":"pais vasco",             "weight":"35.325"         },{             "name":"congreso diputados",             "weight":"17.758"         },{             "name":"castilla y leon",             "weight":"17.689"         },{             "name":"cantabria",             "weight":"17.672"         },{             "name":"autonomías",             "weight":"17.665"         },{             "name":"navarra",             "weight":"17.635"         }     ] }


xml: formato adecuado para cualquier otro lenguaje de programación

<recomendations>      <tags>          <tag>              <name>polí­tica</name>              <weight>79.59</weight>          </tag>          <tag>              <name>zapatero</name>              <weight>61.931</weight>          </tag>          <tag>              <name>vídeos</name>              <weight>53.098</weight>          </tag>          <tag>              <name>gobierno</name>              <weight>35.372</weight>          </tag>          <tag>              <name>pais vasco</name>              <weight>35.336</weight>          </tag>          <tag>              <name>congreso diputados</name>              <weight>17.762</weight>          </tag>          <tag>              <name>castilla y leon</name>              <weight>17.692</weight>          </tag>          <tag>              <name>cantabria</name>              <weight>17.68</weight>          </tag>          <tag>              <name>autonomias</name>              <weight>17.671</weight>          </tag>          <tag>              <name>navarra</name>              <weight>17.642</weight>          </tag>      </tags>      <elements>10</elements> </recomendations>


Formato de la llamada

El formato de la llamada que se debe usar (ya sea con GET o POST) debe contener los siguientes parámetros:

  • q (obligatorio): texto del que se quiere obtener la sugerencia de etiquetas.
  • c: codificación usada en q. Dos posibles valores: utf8 o iso-8859-1. Por defecto, se tomará este último valor.
  • r: formato de salida. Debe contener xml, json o html. Por defecto, se tomará este último valor.
  • k: clave pública. Está disponible en la página de perfil de cada usuario. Este campo es obligatorio si no se está autenticado de manera tradicional ante www.soitu.es

O sea, por ejemplo, para hacer la consulta anterior de XML, los parámetros a pasar serían:

/soitu/met/inferirtags.pl?k=APIkey&q=jose+luis+rodriguez+zapatero&r=xml


Por supuesto, la llamada debe ir contra http://www.soitu.es/.

Recordad que este etiquetado lo hace una máquina, debe servir como una ayuda, que mucho mejor cuanto más descriptivo sea el texto y, sobre todo, la necesaria supervisión humana que confirme las sugerencias.


* Raúl Rivero es el director técnico de soitu.es

Temas relacionados

Selección de temas realizada automáticamente por Autonomy

5 comentarios

Con criterio totalmente subjetivo, como en todos los sitios, los comentarios inapropiados serán borrados. Si quieres firmar tus comentarios, regístrate o inicia sesión »

Muy chulo!

Las etiquetas que sugiere a la historia
http://www.soitu.es/participacion/2008/11/22/u/fernand0_1227349568.html
son:

televisión 17.528

telecinco 17.361

política 12.168

internet 11.681

el descodificador 11.641

youtube 11.604

Olvidé en ... desplegar comentariomi propia selección la de televisión (que le vamos a hacer, soy un teleignorante) pero nunca hubiera pensado en política y entiendo que la de 'el descodificador' es local a soitu.

Gracias por el juguete :)
nº 5 por fernand0 el 22/11/08 a las 18:13
Hola nº 3,

Claro que nos sirve tu feedback y gracias a él hemos encontrado un error en el tratamiento de sinónimos y nombres bonitos. Eso era lo que causaba que, aparentemente, se repitiese una etiqueta que, ... desplegar comentariorealmente, eran dos distintas pero con el mismo "nombre bonito". Creo que ya está solucionado.

Un saludo y gracias :).
nº 4 por rivero el 02/11/08 a las 15:48
si os sirve de feedback, comentaros que he probado con una noticia de nuestro portal y he visto que repite tags y con distinto peso. El texto que le he pasado corresponde a esta noticia: http://www.hola.com/actualidad/200810306788/sarah/obama/kenia/1/
y la etiqueta repetida es 'barack obama'(nada que no ... desplegar comentariose pueda arreglar en la aplicación)
por lo demás parece que funciona estupendamente...
nº 3 por dagi3d el 31/10/08 a las 14:23
No te preocupes, nº 1, que lo contaremos. Lo tengo en la lista de "pendientes" y ya sabes que todo acaba saliendo :). ”
nº 2 por rivero el 28/10/08 a las 19:50
Jolines.

Casi lo entiendo y todo pero, ¿para cuando un tema más de gestión y estrategia?

Algo así como: ...y por estas razones elegimos nginx (engine x) y nos va de vicio...

Y nos da igual que el gurú ... desplegar comentarioStallman nos condene a su fatua y fútil indiferencia por escoger BSD.

Cosas que también molan..
nº 1 por jj_soiyo el 28/10/08 a las 17:04
Di lo que quieras

Aceptar

Si quieres firmar tus comentarios, regístrate o inicia sesión »

En este espacio aparecerán los comentarios a los que hagas referencia. Por ejemplo, si escribes "comentario nº 3" en la caja de la izquierda, podrás ver el contenido de ese comentario aquí. Así te aseguras de que tu referencia es la correcta. No se permite código HTML en los comentarios.

DI LO QUE QUIERAS

Lo sentimos, no puedes comentar esta noticia si no eres un usuario registrado y has iniciado sesión.
Si quieres, puedes registrarte o, si ya lo estás, iniciar sesión ahora.

Nuestra selección

Hasta la vista y gracias

Soitu.es se despide 22 meses después de iniciar su andadura en la Red. Con tristeza pero con mucha gratitud a todos vosotros.

El suplicio (o no) de viajar en tren en EEUU

Fuimos a EEUU a probar su tren. Aquí están las conclusiones. Mal, mal...

Presidimos la UE: que no falten los regalos para los periodistas

Algunos países ven esta práctica más cerca del soborno.

Soitu.es vuelve a ganar el premio de la ONA

A la 'excelencia general' entre los medios grandes en lengua no inglesa.

Tecnología
18:23

Políticos con iPad »

Para bien o para mal, el iPad se ha convertido en un habitual en muchas conversaciones. Ya sea para romper el hielo antes de una reunión o con el café en una comida familiar: defensores y detractores del aparato de Apple salen por doquier. ¿Es para tanto? ¿Vale la pena hacerse con uno? ¿No hace lo mismo que un ordenador?

En: E-Campany@

Recomendación: Albert Medrán

17:21

en La Casa Blanca libera código »

La Administración de Obama sigue dando ejemplo de apertura tecnológica al resto de los gobiernos del mundo: si una de sus banderas es la apertura de datos, ahora te toca al código fuente de módulos de Drupal Traducir »

En: radar.oreilly.com

Recomendación: Raúl Rivero

13:31

en infografia El imparable crecimiento de Internet »

En la BBC han hecho un gráfico impresionante sobre la evolución de Internet entre 1998 y 2008. Visto en elblogsalmon.com Traducir »

En: bbc.co.uk

Recomendación: mami

Estos son nuestros Selectores »

Lo más visto
1

Cómo sellar el paro por internet

RAMÓN PECO (SOITU.ES)
2

Sexo oral para ella

M. PÉREZ, J. J. BORRÁS Y X. ZUBIETA (SOITU.ES)
4

¿Qué es el sexo?

M. PÉREZ, J.J. BORRÁS y X. ZUBIETA (SOITU.ES)
5

Cómo masturbarse adecuadamente

M. PÉREZ, J. J. BORRÁS Y X. ZUBIETA (SOITU.ES)
Widgets

Widget Liga 0910

Clasificación, calendario, equipos, etc. »

Widget El tiempo

Situación actual y previsión de cinco días »

Widget Estaciones de esquí

Estado de las estaciones de esquí »

Widget Loterías y Sorteos

ONCE, Quiniela, Primitiva, etc. »

[Premio ONA a la excelencia en webs de habla no inglesa] [Premio al mejor diseño en internet y a la innovación]