martes, 22 de diciembre de 2015

Google usará el Big Data para ayudarnos a vivir más tiempo

Todo el tiempo le estamos diciendo a internet cuáles son nuestros hábitos. Al dar un click a una página, al subir una foto, al opinar. Al buscar información, también.

Google, a través de su empresa Verily, la empresa que ocupará la letra V en el diccionario del nuevo conglomerado de empresas del buscador, Alphabet, se encargará de investigar la salud, o como ellos mismos dicen en la definición de la empresa, “las ciencias de la vida”.

La apuesta de Verily apunta claramente a los datos, a crear equipos que unan varias disciplinas para conseguir nuevos descubrimientos.

Químicos, médicos, ingenieros y científicos especializados en análisis de datos e informáticos, serán los perfiles más comunes de la nueva empresa.

Tecnología para la salud
La pregunta con la que presentan su página web lo deja claro: “¿Cómo podemos usar la tecnología para tener una imagen fiel de la salud humana?”. La ambición de Google por alargar la vida se centra en conocer mejor el cuerpo humano a través de sensores, análisis de los registros de los usuarios (no necesariamente pacientes), inteligencia artificial, así como dos recursos que atesora en abundancia: almacenamiento de datos y gran capacidad para el procesado.

La finalidad de Verily no consiste en solo estudiar las enfermedades, sino también en investigar la salud.

Uno de los últimos cambios en los relojes con Android Wear, su sistema operativo para aparatos de vestir, apunta en esa dirección. Desde hace más de un año, la compañía investiga junto a Novartis unas lentillas que miden los niveles de glucosa de los diabéticos.

Si a este potencial para conocer datos casi en tiempo real se le suma la capacidad de proceso, la posición de Verily es privilegiada. El último ingrediente es la inteligencia artificial, un componente que los de Mountain View están añadiendo a toda su gama de productos, desde Fotos a Gmail, para tomar patrones y predecir comportamientos.

El aspecto en el que más tienen que mejorar, y reconocen que todavía lo ven como un reto, es conocer mejor la reacción ante las enfermedades. Harán alianzas con sitios web de salud para conocer directamente estas sensaciones. Para eso, se harán alianzas con sitios web como PatientsLikeMe y PatientCrossRoads, que registra miles de historias médicas de todo el mundo.

Pulseras unidas
Verily pretende unir todo el conocimiento que se está acumulando a través de las pulseras que miden el ejercicio y los medidores de pulso, para tener mejor conocimiento del ser humano.

lunes, 21 de diciembre de 2015

¿Qué es una base de datos?

Entendemos a una base de datos como un almacén donde guardamos una colección o conjunto de informaciones (texto, imagen, sonido, video...) las cuales se encuentran relacionadas entre sí y pueden ser accesibles y consultadas en cualquier momento.

Existen programas para la creación, manejo y gestión de bases de datos digitales, en donde podemos almacenar enormes cantidades de información de cualquier tipo así como realizar cualquier consulta y obtener el dato en apenas unos segundos, todo ello ocupando un espacio de un disco duro. De esta forma es posible cruzar variables y obtener mejores resultados.

¿Qué es un asistente virtual?

Un asistente virtual es un programa informático capaz de reconocer el lenguaje natural utilizado por el usuario permitiendo establecer una conversación para responder preguntas, hacer recomendaciones o realizar acciones solicitadas, aprovechando la capacidad de almacenamiento y procesamiento que disponen las computadoras y múltiples dispositivos móviles. Con la finalidad de mejorar la experiencia de uso los programadores dotan al asistente virtual de una voz y aspecto humano.

Uno de los últimos asistentes lanzado al mercado es Cortana.

Cortana es el asistente personal virtual que incluyen diversos dispositivos. Cortana reconoce el lenguaje natural (sin necesidad de utilizar comandos concretos) y utiliza Bing, Yelp y Foursquare como bases de datos. Sustituye a la búsqueda integrada de Bing en Windows Phone 8.1 y se activa pulsando el botón de búsqueda.

Se diferencia de Google Now y de Siri en que es el primer asistente virtual que incluye una “Libreta”, donde Cortana guarda toda la información que tiene sobre el usuario, sus intereses, rutinas, etcétera. De esa manera la información que el sistema tiene del usuario es fácilmente controlable, pudiendo borrar todo rastro o introducir a propósito sus gustos y demás para mejorar el servicio. También es el primer asistente que permite a los desarrolladores integrarse con él, permitiendo utilizar sus aplicaciones mediante la voz.

Dos medios, a la vanguardia en el análisis y liberación de datos

Los Tiempos y La Pública son los primeros medios de comunicación que han iniciado una labor en periodismo de datos en el país. El primero comenzó su aventura en 2013 y el segundo un año después, en 2014.
"Los Tiempos ha sido el primer periódico que ha incorporado una unidad de periodismo de datos dentro de su portal web”, explica Fabiola Chambi, quien forma parte de esta unidad junto con el gerente de proyectos de ese medio, Mauricio Canelas, y el programador Raúl Vera .

Sobre esta experiencia, Chambi explica que conseguir datos en portales gubernamentales aún es una tarea complicada. "Por ejemplo, presentan informes de datos económicos en PDF y eso no nos sirve en periodismo de datos porque se requiere que estos sean reutilizables”, afirma.
De ahí que hacer este trabajo se convierte en una labor de paciencia, no sólo al gestionar y acceder a la información pública, sino en su transcripción y conversión a datos abiertos.

A escala mundial opera la Alianza para el Gobierno Abierto, a la cual más de 60 gobiernos se han suscrito para comenzar a liberar sus datos. "En la región, Bolivia, Ecuador y Venezuela son los únicos países que no forman parte de esta Alianza. Se ha consultado a gente del Gobierno por qué no se han suscrito y ellos dicen que no han visto necesario ingresar porque manejan una cultura de la transparencia. Pero, en los hechos, no es así, pues acceder a datos públicos es muy complicado”.

Desde 2013 hasta la fecha, Los Tiempos Data trabajó temas referidos al Censo Nacional, las elecciones, además de la popularidad del Presidente en redes sociales, entre otros. "No se ha podido hacer investigaciones profundas aún. Sin embargo, tenemos algunos proyectos que tienen que ver con la liberación de datos de declaraciones juradas y otros”.

La otra iniciativa llega junto a La Pública. Se trata de una plataforma de periodismo digital y de datos enfocada a temas de ciudadanía. Inició su trabajo en mayo de 2014. "Ha sido un trabajo duro, pues los periodistas que trabajamos en esta plataforma venimos de medios impresos tradicionales. Dar el salto para entender las lógicas del digital ha sido una tarea complicada e interesante”, explica Mabel Franco, coordinadora de la plataforma.

En periodismo de datos La Pública ha trabajado liberando los datos de los programas de gobierno de los alcaldes de los nueve departamentos. "Este trabajo lo llamamos el Promesodromo, la idea es que el ciudadano pueda acceder a esos datos con mayor facilidad y pueda hacer un seguimiento de los proyectos que sus alcaldes se han comprometido a liberar”.

Otro proyecto de esta plataforma llega con Cuántas Más, que busca recopilar data que se halla dispersa -en instancias públicas y organizaciones de la sociedad civil- para armar un mapa sobre los casos de feminicidio en Bolivia.

Comenzó en 2012
Hackathones Según Willmar Pimentel, coordinador del Bolivia Tech Hub, la semilla del periodismo de datos en Bolivia se sembró en 2012, cuando se llevo adelante la hackathon Desarrollando América Latina. "En este encuentro se buscó que periodistas y desarrolladores se acerquen y conozcan lo que eran los datos abiertos con el fin de hacer aplicaciones”.
Dinero Otro de los momentos importantes en el desarrollo del periodismo de datos en Bolivia ocurrió en 2014, cuando se desarrollo "La ruta del dinero”, una hackathon que se convertiría, junto a Los Tiempos Data, en una de las dos iniciativas fundamentales para implementar el periodismo de datos en Bolivia.

Punto de vista
JAVIER BADANIMediactivista
"Aún desconfían de las nuevas tecnologías”

Gran parte de los periodistas aún desconfían de las nuevas tecnologías y, más aún, de la idea de trabajar información con personas que no son periodistas en este caso, por ejemplo, los programadores.

Es por ello que las lógicas del periodismo de datos -trabajo multidisciplinario que une periodistas, desarrolladores informáticos, diseñadores pero, además, que implica el manejo de herramientas digitales para trabajar con la data- recién están comenzando a ser tímidamente conocidas por los periodistas y las direcciones de medios bolivianos.

Obviamente, se requiere de mayor inversión para contar con una unidad de periodismo de datos, pero Los Tiempos ha demostrado que sí es posible.

Por otro lado, hay una cosa clara: periodismo de datos es periodismo igual (la base del periodismo es la búsqueda de datos y su interpretación). Lo importante para mí -más que la posibilidad de conseguir data, interpretarla y presentar la información de manera atractiva gracias a nuevas herramientas digitales- es la lógica de apoyarte en el trabajo colaborativo.

De entender que la era del yo ha terminado y que se requiere de inteligencia colectiva para enfrentar los retos que nos plantea esta era de la vorágine de la información.

Además, esta nueva forma de abordar la cobertura periodística amplía las posibilidades de trabajar la información. Esto porque los datos no mienten. Una autoridad puede intentar "camuflar” un hecho, pero serán siempre los datos los que lo delaten.

Plataforma pone bajo la lupa los contratos “jugosos” del Estado

Los contratos millonarios del Estado y la oferta de universidades públicas y privadas del país son los ejes de dos de tres investigaciones de periodismo de datos que serán publicadas a principios de 2016. Todas éstas estarán disponibles en plataformas online para que el ciudadano acceda a los datos.

Las iniciativas son resultado del primer Acelerador de Datos #DataBO, que en mayo de este año reunió a periodistas y programadores para que diseñen proyectos de investigación en periodismo de datos. "Se presentarán oficialmente en febrero y se espera que sean adoptados como herramientas de información por los medios de prensa del país”, explica el mediactivista Javier Badani.
Esta experiencia ha permitido ver algunos aspectos que los periodistas deberán encarar a la hora de ejercer estos proyectos. "Hemos visto que los datos que publican las instancias estatales son dispersos, no son inteligibles y lo peor es que por lo general están en PDF”, expresa Jhenny Nava, del diario Opinión, quien participó del proyecto Contrato Abierto.

Esta iniciativa indaga en las contrataciones de publicidad, inversiones y proyectos del Estado más caros de los últimos cinco años, publicados en el Sistema de Contrataciones Estatales (Sicoes). "Lo que se ha hecho es procesar, analizar y liberar esa información”, dice Nava.

Para la periodista es importante que las redacciones apuesten por este tipo de investigación. "Detrás de los datos hay noticias reveladoras. Sin embargo, para mantener esta plataforma es importante tener el apoyo de los medios, pues de lo contrario sería muy difícil actualizarlas”.

Otro de los proyectos próximo a publicarse es ¡Que no te la charlen!, que plantea dos ejes de estudio. "Por un lado, la oferta universitaria, y por otro, la inversión del presupuesto de estos centros. A largo plazo también podríamos investigar la oferta laboral del país”, indica Fabiola Chambi, del diario Los Tiempos.

Chambi explica que para que este tipo de investigaciones alcance resultados óptimos se requiere de un equipo multidisciplinario que incluya, al menos, un periodista, un diseñador y un programador. "Sin este equipo es prácticamente imposible”.

Los datos abiertos responden a una filosofía que busca poner a disposición de la sociedad los datos que gestiona la administración pública en formatos fáciles de manipular, se lee en el sitio del DataBO.
El periodismo de datos pone a disposición de los lectores los "datos originales sobre los que se llegaron a conclusiones periodísticas, dando así un salto cualitativo en la búsqueda de mayor transparencia”, se lee en el sitio del diario La Nación, pionero en la región en esta práctica.

Contrato Abierto revela inversión en publicidad, adquisiciones y costo de obras
"A lo largo de la investigación hemos identificado que hidrocarburos, carreteras y transporte son los tres rubros que tienen los contratos más jugosos del país”, expresa la periodista Jhenny Nava, investigadora de la plataforma Contrato Abierto, donde se ha sistematizado información publicada en el Sistema de Contratación Estatal (Sicoes).

"Luego de la polémica entre el Gobierno y la periodista Amalia Pando, quien se vio obligada a dejar la red ERBOL por presiones gubernamentales, nos pusimos a investigar también sobre la inversión de publicidad estatal. Los datos que han saltado son realmente reveladores”, manifiesta.
Como adelanto, explica que red Uno, Bolivia TV e Illimani de Comunicaciones son las empresas con mayor facturación por publicidad estatal en los últimos cinco años.

"También se han analizado las compras más costosas. Se ha visto que Yacimientos Petrolíferos Fiscales Bolivianos (YPFB), por ejemplo, ha invertido en esta primera mitad de la década más de seis mil millones de bolivianos por compra de productos derivados de petróleo a refinerías”.

Pero Contrato Abierto no queda únicamente en el proceso y análisis de datos. "Tiene un segundo componente, pues también se van a publicar las licitaciones que salgan en el Sicoes, para que la gente acceda a información más detallada sobre esos procesos de contrataciones”, indica Nava.

¡Que no te la charlen! trae información sobre las universidades públicas y privadas

¡Que no te la charlen! es otra de las plataformas de periodismo de datos que ha reunido a periodistas de La Pública y del diario Los Tiempos, de Cochabamba. Juntos efectuaron una exhaustiva búsqueda y seguimiento de la oferta académica de las universidades públicas y privadas.

"Se trata de un proyecto sobre educación superior en Bolivia. Partimos de la premisa de que la información de las universidades está dispersa o no es accesible para el público que la necesita. Por tanto, se ha hecho un trabajo de hormiga para encontrar los datos, sistematizarlos, concentrarlos y liberarlos”, indica Mabel Franco, periodista que participa en el proyecto.

¡Que no te la charlen! ofrece información de universidades privadas y públicas sobre carreras, dónde se ofrecen o cuánto duran. De esta forma, identificaron que las carreras de Ingeniería de Sistemas, Administración y Contaduría se pueden encontrar en prácticamente todas las universidades del país. "Es importante mencionar que la mayor parte de la oferta es privada y se concentra en las capitales del eje troncal del país”.

Sobre la experiencia , Franco manifiesta que este proceso les mostró que las universidades no piensan en el ciudadano. "En temas de presupuesto, por ejemplo, cada casa de estudios superiores pública hace lo suyo. Nadie se ha ocupado de facilitar la información que te permita comparar”. "El proyecto nos ha mostrado que periodistas de un medio digital y uno impreso pueden trabajar juntos”.

martes, 15 de diciembre de 2015

Sandra Crucianelli, periodista argentina y experta en el tema “No es posible un Gobierno abierto sin modernización”

¿Qué son los datos abiertos y cuál su importancia?
Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona. Están al requerimiento de atribución y de compartirse de la misma manera en que aparecen. Son importantes porque contribuyen en el aumento de los niveles de acceso a la información pública y porque permiten encontrar noticias en grandes volúmenes de datos.
¿Qué es el gobierno abierto?
Gobierno Abierto, Innovación y Modernización forman parte del mismo concepto global: una doctrina política que promueva desde el Estado la difusión de datos abiertos sobre cuestiones de interés público (como presupuesto o compras del Estado), promoviendo de ese modo el control social a través de la rendición de cuentas.
Los ciudadanos no están ajenos. Participan activamente usando la información pero también aportando nuevos datos o proponiendo ideas que les permitan mejor calidad de vida. No puede haber gobierno abierto posible sin innovación ni modernización.
¿Por qué es importante que los gobiernos consideren liberar sus datos?
Porque la información liberada se constituye en una herramienta para promover la transparencia, pero también el compromiso y la participación ciudadana.
¿Se podrán liberar todos los datos de las entidades estatales? ¿Cuáles son los criterios que se deben tomar en cuenta?
Cualquier conjunto de datos es susceptible de ser liberado, siempre que no esté sujeto a restricciones legales que atenten contra las leyes de seguridad, defensa o protección de datos personales.
Si bien los datos abiertos son una necesidad, ¿cuáles serán las áreas que indispensablemente tendrían que liberar sus datos para que el ciudadano se beneficie de ellos?
Son importantes los datos sobre ejecución de fondos públicos, compras del Estado, indicadores de salud, educación, justicia, obras públicas y seguridad, entre otros.
¿En qué medida el ciudadano puede incidir en la construcción de políticas de su ciudad o país a partir de los datos abiertos?
La base de incidencia es la participación. Es un proceso que no surge solo. Hay que promoverlo en dos vías, desde la sociedad civil hacia el Estado y desde el Estado hacia la sociedad civil.
¿En qué aspectos deben pensar los gobiernos al plantear la creación de una ley que permita la liberación de datos?
Las leyes de acceso a la información pública deberían contemplar la obligatoriedad de liberar los datos gubernamentales y aquellos de empresas que sean de interés social, como los generados por empresas de servicios públicos. La filosofía que plantea la Alianza de Gobierno Abierto, (OGP), es un marco de referencia importante.
¿Cuál es el panorama a nivel mundial sobre la liberación de datos a nivel gubernamental?
En 2011 comenzó a gestarse un movimiento interesante a nivel mundial, promovido por varios países. Así se creó la Alianza de Gobierno Abierto, que describe el estado de compromiso y desarrollo de cada país que se ha sumado a la iniciativa. Hay algunos que están más avanzados que otros, y ciertos países que directamente no se unieron porque no comparten la filosofía y obviamente, no tienen interés en abrir sus datos a los ciudadanos.

HOJA DE VIDA


Perfil Es periodista especializada en periodismo de investigación y de precisión, así como en varias de sus herramientas digitales.
Actividades Es docente del Programa de Educación Virtual del Centro Knight para el Periodismo en las Américas y miembro del consejo asesor de la Fundación para las Américas de la OEA.

Autonomías y el TSE liberaron datos al público

Este diciembre, las oficinas públicas bolivianas comenzarán a dar cuenta de sus gestiones. Serán rendiciones enfocadas a mostrar los resultados y la ejecución de los recursos a lo largo del año y con ello habrán cumplido en temas de transparencia, pero, ¿será ésta la forma ideal de transparentar la información pública?

Para el experto en nuevas Tecnologías de la Información y Comunicación (TIC) Pablo Andrés Rivero esta forma tradicional de dar cuenta de la gestión ya no es suficiente. "Hoy existe una tendencia mundial que promueve la liberación de datos a través de las nuevas tecnologías, con el fin de que el ciudadano realice un seguimiento y control social más efectivo de estos procesos”.
Los datos abiertos son accesibles y reutilizables, sin exigencia de permisos específicos. No obstante, los tipos de reutilización pueden estar controlados mediante algún tipo de licencia. El concepto datos abiertos responde a una "filosofía y práctica, que persigue que determinados tipos de datos estén disponibles de forma libre para todo el mundo, sin restricciones de derechos de autor, de patentes o de otros mecanismos de control”, se lee en el sitio Open Knowledge Foundation.

En la actualidad, explica Rivero, hay una alianza internacional de datos abiertos, promovida por organizaciones de la sociedad civil, a la que se han sumado más de 60 gobiernos que se han comprometido en convertirse en gobiernos abiertos, algunos de ellos de la región como México.
¿Cómo va Bolivia en este tema?
En el país se han dado algunas iniciativas aisladas en oficinas como el Servicio Estatal de Autonomías (SEA) y el Tribunal Supremo Electoral (TSE), que se animaron a liberar algunos de sus datos. Sin embargo, han sido iniciativas que se han logrado gracias a la voluntad de sus representantes, pues en Bolivia no se tiene una ley de gobierno abierto para la transparencia y tampoco se promueve la liberación de datos.
En el caso del TSE se "liberaron datos, antes de las elecciones subnacionales de 2015. Datos sobre el número de votantes (edad, sexo, municipio, macrodistritos y hasta número de inscritos por mesa)”, recuerda Rivero.
También se liberó datos sobre los resultados de anteriores elecciones. "Eso no quiere decir que hayan dado a conocer datos personales de los votantes”. La experiencia llamó al debate sobre la pertinencia de hacer pública esta información. "Hay quienes consideran que no se deberían abrir los datos del padrón electoral porque incluye información personal de los inscritos”. Otros consideran lo contrario, pues "el padrón es de dominio público y conocerlo serviría a las organizaciones para hacer un control sobre los resultados”.
En el caso del Servicio Estatal de Autonomías, en septiembre de este año se llevó adelante la primera hackathon (reunión de desarrolladores) en una oficina estatal para elaborar prototipos para la liberación de datos, como leyes y fichas autonómicas.

"Esta iniciativa nació de la directora ejecutiva del SEA. Coordinamos con el Observatorio de la Bolivia Autonómica, que maneja datos valiosos sobre la entidades territoriales autónomas referidos a su demografía, composición y otros”, cuenta Gabriela Bascopé, jefa de la unidad de comunicación de esa oficina.
Para esta hackathon se liberaron todas las leyes municipales que el Servicio Estatal de Autonomías maneja, además de las fichas autonómicas que dan cuenta de datos de los gobernantes y las características de cada municipio.
Se convocó a equipos de programadores y periodistas para que realicen un análisis de los datos y propongan prototipos que permitan al ciudadano conocer los procesos, legislatura y otros detalles de sus municipios.
Al evento, denominado #HackPúblico, se inscribieron tres equipos. El ganador, conformado por Williams Chorolque y Ariel Canaviri, propuso una plataforma que albergue las leyes municipales en formato de datos abiertos, es decir: no en pdf, ni en imagen, sino en un formato que permitirá al ciudadano acceder al texto y poder hacer búsquedas específicas. En esa oportunidad, los ganadores accedieron a un fondo para desarrollar el prototipo.

Transparencia y legislación

En el país se han dado tímidos pasos en la búsqueda de transparencia y acceso a la información. Se ha creado una Agencia de Gobierno Electrónico, con la que se busca mayor eficiencia en el servicio que las oficinas estatales brindan al ciudadano. Sin embargo, a decir de Rivero, aún no se tiene una legislación sobre gobierno abierto que impulse la transformación de la información a datos abiertos, en términos de transparencia, pese a que la Constitución Política del Estado promueve esto.

Por ejemplo, en el parágrafo II de la Sección IV de Ciencia, Tecnología e Investigación establece que : "el Estado asumirá como política la implementación de estrategias para incorporar el conocimiento y aplicación de nuevas tecnologías de información y comunicación”.
Mientras que, en su artículo 242 , apartado 4, la norma indica que el Estado debe generar un manejo transparente de la información y del uso de los recursos en todos los espacios de la gestión pública. "La información solicitada por el control social no podrá denegarse y será entregada de manera completa, veraz y oportuna”. ¿En qué medida se cumple esto?
A decir de Rivero, en el país se tiene una Ley de Transparencia y Control Social que establece que toda instancia pública debe presentar sus datos, pero éstas lo hacen en función de sus resultados. "Es un power point que no le servirá de mucho al ciudadano porque no podrá conocer el proceso”.

lunes, 14 de diciembre de 2015

Formatos de datos en la web

En la tesis de Chang y Villavicencio, escrita el año 2007 con el título “Análisis, diseño e implementación de un marco de trabajo para la generación rápida de aplicaciones Web multimedia interactivas”, los formatos estructurados son formatos descriptivos que permiten dar forma o estructura a un objeto cualquiera de manera estandarizada. Se los denomina estructurados, porque están orientados a ser interpretados por los lenguajes de programación, ahorrando caracteres al ser utilizados, es decir, minimizan el nivel de procesamiento en lo más posible. Dos de los formatos más utilizados para la Web son el lenguaje de marcado extensible y la notación objeto del lenguaje de programación Java,

Otero, en la tesis de grado escrita el año 2014 con el título “Estudio técnico de la factibilidad y propuesta tecnológica para sistemas de monitoreo en los sistemas de transporte público”, menciona que el lenguaje de marcas extensible ha experimentado lo que se podría considerar como un camino común dentro de las tecnologías de la información y la comunicación. Comenzó en los años 1990 como una solución a un problema particular que muy pocos utilizaban, después se fue extendiendo su uso conforme las computadoras aumentaban su capacidad de procesamiento y las herramientas para la traducción del lenguaje de marcas extensible fueron mejorando, eso generó que el lenguaje se volviese mucho más sofisticado y generalizado. Últimamente ha existido una disminución en el uso de este lenguaje debido a una cantidad de problemas y puntos débiles que tienen las herramientas de traducción y el nacimiento de nuevas alternativas, sin embargo sigue siendo un lenguaje ampliamente utilizado en sistemas de configuración y algunas interfaces de programación de aplicaciones alrededor del mundo. Este formato es en realidad una versión simplificada del lenguaje de marcas general estándar, que es un estándar de documentación internacional desde la década de los años 1980. Sin embargo, el lenguaje de marcas general estándar es demasiado complejo especialmente para la Web. Por ello Jon Bosak desarrolló un grupo en el “Consorcio de la Web” que permitiera crear un nuevo lenguaje derivado de este para su utilización en el internet. El lenguaje de marcas extensible puede ser visto como un metalenguaje que permite crear y expandir formatos propios. Esto lo diferencia de lenguajes como el lenguajes de marcas de hipertexto en donde ya existen etiquetas establecidas, por ello no es posible crear etiquetas propias y esperar que exista una comunicación correcta con el receptor. En el lenguaje de marcas extensible es permitido crear etiquetas con nombres propios y configurar las opciones de estas de manera propia.

En el artículo publicado por Crockford, el año 2006 con el título “Aplicación json, tipo de soporte para la notación objeto del lenguaje Java”, se menciona que la notación objeto del lenguaje de programación Java es un estándar abierto basado en texto que permite el intercambio de información. Es fácil de ser leído por los seres humanos, es independiente de la plataforma en la que se lea y es manejado por una gran cantidad de aplicaciones a nivel global. La codificación no aumenta mucho la cantidad de bytes a la información por lo que es conocido como un formato ligero. Inicialmente fue pensado para ser utilizado con el lenguaje Java, aunque su utilización se ha extendido a otros lenguajes que lo manejan para realizar operaciones, peticiones, respuestas, y otras, de manera síncrona o asíncrona. La sintaxis de notación objeto del lenguaje de programación Java fue creada a partir de lo que se conoce como objetos literales en Java, que son representaciones de objetos en la que los atributos y sus valores son escritos y separados por algún símbolo en común. A pesar de que Java tiene una gran flexibilidad con la representación de sus datos, el formato de la notación objeto del lenguaje de programación Java no es tan abierto para mantener compatibilidad entre lenguajes. El estándar establece que el nombre del atributo y el valor deben de estar contenido siempre entre comillas dobles mientras que Java permite omitir estas comillas o poner comillas simples en el nombre del atributo siempre y cuando no sea una palabra reservada. La ventaja de la notación objeto del lenguaje de programación Java se encuentra en su simplicidad. Un mensaje con éste formato está compuesto por un objeto en el más alto nivel. Los tipos de elementos guardados dentro de la estructura pueden ser objetos o arreglos.

Chang y Villavicencio, en la tesis de grado citada, mencionan que el lenguaje de marcas extensible es un formato de código Web muy parecido al lenguaje de marcas para hipertexto al ser descrito con etiquetas, pero en realidad el lenguaje de marcas para hipertexto es derivado del lenguaje de marcas extensible porque las etiquetas utilizadas son definidas, en cambio el lenguaje de marcas extensible simplemente permite la representación de datos en dicho formato. Es también descriptivo, jerárquico y comprensible por los navegadores, al detallar cada elemento con diferentes banderas y propiedades en lenguaje natural. Ajax, una tecnología para desarrollo Web, se basa mucho en el formato lenguaje de marcas extensible para crear componentes y muchos tipos de comportamiento en las aplicaciones Web. La notación objeto del lenguaje de programación Java es un formato de representación de contenidos u objetos, orientado a su fácil y rápida interpretación por una computadora, y para su ágil proceso de interpretar datos y aplicarles una gramática definida previamente para que el resultado final sean los mismos datos en otro formato. Es sencillo de entender, y a diferencia del lenguaje de marcas extensible, está orientado a ser interpretado por una computadora más rápidamente, pues se utilizan llaves para separar grupos de contenidos, y textos descriptivos para nombrarlos.

lunes, 7 de diciembre de 2015

Primera parte Formatos de datos en la web

En el documento titulado “Estándares de formato de archivos de ofimática” publicado por la Comisión Sectorial de Desarrollo Informático de la Universidad de la República en el año 2008, se menciona que en tecnología y en general, un estándar es una especificación que regula la realización de ciertos procesos o la fabricación de componentes para garantizar la interoperabilidad. En informática, un formato de almacenamiento es la estructura usada para grabar datos en un archivo. Un formato de documentos es una especificación que determina cómo debe almacenarse en un archivo la información contenida en un documento. Los formatos pueden ser propietarios ó abiertos. Un formato propietario es propiedad de su fabricante. Su uso por parte de terceros está condicionado a los permisos que el propietario otorgue. Estos permisos dependen generalmente de decisiones comerciales. Las especificaciones de formatos propietarios generalmente no son públicas. Esto restringe el acceso a archivos que han sido almacenados con formatos propietarios. Un formato abierto es de uso libre. Las especificaciones se encuentran disponibles en forma gratuita y no se requiere un permiso del fabricante para desarrollar software que las utilice para almacenar o abrir documentos.

Según Chang y Villavicencio, en la tesis de grado escrita el año 2007 titulada “Análisis, diseño e implementación de un marco de trabajo para la generación rápida de aplicaciones Web multimedia interactivas”, es necesario tener estándares en los cuales la información debe de ser presentada, de lo contrario el desarrollo de cualquier aplicación sería un caos, pero tampoco puede existir un formato único, ya que cada uno es creado con el fin de satisfacer ciertos requerimientos y necesidades, tanto para el desarrollador, como para la computadora. Los formatos de datos en la Web más importantes, se agrupan en dos grupos grandes: Formatos parcialmente estructurados y formatos estructurados. En primera instancia se presentaran los formatos parcialmente estructurados, o semi-estructurados, los cuales se encuentran orientados a ser leídos tanto por navegadores y lenguajes de programación, como por programadores, y llevan este nombre porque sus estructuras están separadas por encabezados o etiquetas legibles, es decir, la mayoría de estas etiquetas se encuentran en lenguaje natural, de manera organizada y jerárquica, siendo su representante visible el lenguaje de marcas para hipertexto.

En la tesis de grado de Bautista, escrita el año 2013 con el título “Sistemas de apoyo a los servicios académicos que ofrece el Programa de Atención Diferenciada para Alumnos”, se menciona que el lenguaje de marcas para hipertexto es el lenguaje de marcado predominante para la elaboración de aplicaciones Web que se utiliza para describir y traducir la estructura y la información en forma de texto, así como para complementar el texto con objetos tales como imágenes. El lenguaje de marcas para hipertexto se escribe en forma de “etiquetas”. Este lenguaje de marcado toma como base la sintaxis del lenguaje estándar generalizado de marcas. Esto quiere decir que los diferentes elementos, entre los cuales se cuentan los párrafos, encabezamientos, tablas, listas de un documento para la Web, se señalan intercalando etiquetas que indican al navegador cómo debe mostrarlo. El uso del hipertexto se ha convertido en una de las bases de Internet, lo que ha popularizado enormemente el lenguaje de marcas para hipertexto, hasta el punto de convertirlo en un verdadero estándar. Posteriormente, los navegadores son los encargados de leer este lenguaje y traducir los elementos que representan, mostrándolos directamente en pantalla. Su funcionamiento se basa en el uso de etiquetas o códigos, que permiten dotar de unas determinadas características y propiedades a los textos y elementos que engloban. La sintaxis del lenguaje de marcas para hipertexto contiene: (1) Una etiqueta inicial que señala el comienzo de un elemento. (2) Un número determinado de atributos y sus valores asociados. (3) Una cierta cantidad de contenido, entre los que se cuentan caracteres y otros elementos. (4) Una etiqueta que marca el final. El lenguaje de marcas para hipertexto no es más que una aplicación del lenguaje estándar generalizado de marcas, un sistema utilizado para definir tipos de documentos estructurados y lenguajes de marcas para representar esos mismos documentos. El término lenguaje de marcas para hipertexto se suele referir a ambas cosas, tanto al tipo de documento como al lenguaje de marcas.

Chang y Villavicencio, en la tesis de grado citada anteriormente, señalan que el lenguaje de marcas para hipertexto es el formato más general y común en la red. Este formato es el utilizado por todos los sitios Web y permite dar formato a las páginas que son visitadas por los navegadores. Una página Web está compuesta por lo general de una cabecera y un cuerpo, dentro de los cuales se introduce código de formato de marcas para hipertexto, para dar estructura al documento, para incorporar distintos medios y para proveer vínculos a otros sitios. Todo contenido debe estar dentro de etiquetas para ser reconocido por el navegador, caso contrario, éste lo interpretará como texto ordinario del contenido del sitio. En un sitio de marcas para hipertexto es posible incorporar etiquetas con lenguajes de programación para insertar funciones, y es posible además darle formato a un sitio por medio de hojas de estilo. Existen formatos estándares simplemente para definir el diseño de una página Web. El estándar más aceptado en este medio es la hoja de estilo en cascada, que consiste en un lenguaje simplificado, que utiliza medio de llaves para separar diferentes formatos, siendo éstos miembros de clases o poseen identificadores propios. De ésta forma, es posible cambiar todo el diseño de un sitio Web con tan solo alterar la sección de la hoja estilo en cascada de la página por otra. Este formato utiliza palabras en inglés para describir el formato a tener de cada sección de la página, y posee ciertos comandos para manipular algunos eventos básicos como cambios dinámicos en una sección, o efectos del ratón.