viernes, 15 de noviembre de 2013

15.11.13: la T.I.C. y la crisis contemporánea de visión detrás de estrategia

________________________________________
From: EDWARD J. MCDONNELL
Sent: Friday, November 15, 2013 18:55
To: Marco Barcenas Puga
Cc: nedmcd.peacecorps@gmail.com
Subject: Artículos semanales. Hacia la gerencia de datos, frente a aquella de conocimientos, ambas como insumos en la T.T.

Estimadas damas y respetados caballeros,

Aquí tienen los artículos semanales. Primordialmente, quiero dar una bienvenida cálida al Sr. Marco Bárcenas-Puga; este consultor brillante fue el líder técnico para el despliegue exitoso de, y el instructor principal en cómo aplicar, el E.P.M. a través de CIDESI  Como un líder interno aquí, el Sr. Bárcenas será un agente de cambio entre ustedes.  Sin necesidad decirlo, es un paso propicio ahora tomado por su Centro hacia la transferencia de tecnología.  Resumen de Noticias.  De veras la semana estaba lento excepto para actividades en nanotecnología y nano ciencia a través del mundo ibérico, junto con desarrollos en aeronáuticos en Querétaro y la lucha cada vez intensa sobre la privatización parcial de PEMEX.

En las ciencias, hay dos cumbres nanotecnológicas en SurAmérica esta semana mientras que la nanotecnología tiene visionarios fanáticos en España. En las aeronáuticas, Airbus cree que pedidos van a superar el nivel clave de 1.200 jets en 2013 mientras que Boeing está progresando a través de sus problemas con el jet ‘787Dreamliner’.  A continuación, se encuentra un discusión sobre una nueva norma aeronáutica sobre la seguridad.
El Nuevo Anexo 19 sobre sistemas de gestión de la seguridad para la aviación
En el tecnovación americana, hay tendencias financiación de las PYME, con ideas revolucionarias para productos de tecnología, mientras que Nuevo León es el establecimiento y la financiación de una incubadora para transferir la tecnología. En la Dirección queretana, hay algunas preocupaciones emergentes sobre la expansión por delante de Querétaro mientras China está perdiendo prestigio en un momento cuando hay incertidumbre creciente sobre sus políticas económicas.

La lectura para esta semana hace frente a dos temas claves para los próximos años de CIDESI. Primeramente, ¿cuáles son las preguntas importantes que la Dirección General debería tener en su evaluación de sistemas actuales o posibles de T.I.? (McKINSEY QUARTERLY). Sin embargo, es necesario  entender el impacto de ‘BIG DATA’ en el mundo contemporáneo (FOREIGN AFFAIRS; NEW YORK TIMES).  (http://online.wsj.com/article/SB10001424052702303618904579169940150748838.html?mod=WSJS_gestion_LeadStory).  Gracias, como siempre, a la Sra. Magda Durán-Robledo, un editor extraordinario por razones más allá de su belleza, paciencia y cortesía.

Además, aquí está una discusión sobre la disponibilidad y riesgos de ‘BIG DATA’, como se aplican por aquellos sin temperamentos adecuados. Gracias al Sr Roy Rajan, cooperante anterior del Cuerpo de Paz, por haberme enviados estos dos artículos traducidos oportunos. En esas traducciones, es interesante que la aplicación de los datos infinitos sea similar a la filosofía presentada la semana pasada del análisis financiero.

Introducción: un dilema táctico durante la edad de la información
Esta penúltima carta sobre los desafíos frente al Centro no implica finanzas ni contabilidad directamente.  La carta para la semana que viene se ha cancelado para dar paso al cincuenta aniversario del asesinato del presidente Kennedy. De hecho, aborda la creación, divulgación y administración de los conocimientos dentro de CIDESI. Con el despliegue del E.P.M. en progreso rápido, este reto se emergerá como una tensión entre el software del E.P.M. y la próxima generación de BAAN recientemente introducida a algunos miembros del Centro.
Fuera de algunos enlaces para transferir datos específicos, estos sistemas no son compatibles. Más significativas que esta desconexión, hay diferencias emblemáticas entre los dos sistemas. El E.P.M. es difundido completamente a través de las Direcciones operativas (es decir, a los usuarios dirigidos) mientras que el nuevo BAAN es reservado para menos de una mitad de los usuarios regulares del sistema actual. ¿Por qué?
  1.  BAAN es un sistema centralizado, de arriba hacia abajo, para controlar la contabilidad de recursos
  2. el E.P.M. es un software, de abajo hacia arriba, para asignar y seguir recursos.
Entidades verdaderamente innovadores tienen éxito en mantener un equilibrio entre ‘la toma descentralizada de decisiones’ frente a ‘rendición de cuentas centralizada’; es decir, entre eficacia externa versus eficacia interna. La gerencia de una tal desarmonía creativa se vuelve crítica cuando se debe enfrentar a una elección entre la liberación del talento (el elemento indefinido – o, ‘fuzzy’ – de innovación) frente a la codificación de hechos.  Una se enfoca en los conocimientos principalmente tácitos, mientras que la otra intenta sistematizar conocimientos explícitos.

Entonces, ¿dónde se encuentra su Centro ahora?
Primordialmente, CIDESI necesita dos funcionarios establecidos en una oficina de transferencia de tecnología (O.T.T.).  Estos socios iguales tendrán enfoques opuestos. El  oficial de la transferencia de tecnología se debe centrar fuera de su Centro en buscar conexiones mediante las que CIDESI pueda canalizar tecnología, servicios o conocimientos. El otro intermediario de información debe fomentar discusiones animadas, aún polémicas, entre miembros de las varias disciplinas. Asimismo, su Centro necesita un sistema que puede conciliar la emoción imprecisa de la creatividad con los datos duros informados a la S.H.C.P. para minimizar el fraude, desperdicio y abuso de los recursos mexicanos.

Dicho mandato es muy difícil de establecer y sostenerlo con el tiempo.  De veras, la innovación es un desperdicio evidente de recursos hasta que esa única idea – emergente de vez en cuando – prospera en el mercado para compensar, más que adecuadamente, por las muchas decepciones anteriores. Sin embargo, su Centro tiene el deber de cumplir las obligaciones de un fiduciario en salvaguardar el patrimonio del pueblo mexicano.  Es porqué todo este "blablabla" (es decir, 'la innobloviación') de la reestructura, con sus cambios culturales, tiene una significado primordial para cada uno de ustedes.

Si, en sus prácticas de aquí en adelante, CIDESI insiste en mantener el sentido tradicional de la jerarquía – incrustado profundamente en el psique mexicano por cuatro siglos (al menos) – las probabilidades de una prosperidad futura, independiente del gobierno, serán nulas. Por tanto, y con sabiduría, su Centro ha elaborado un sistema desarticulado que refleja esta dualidad difícil por ahora.  Dos sistemas comprenden tres funciones.
BAAN frente a E.P.M.
Primero, se encuentra BAAN, que es un sistema informático configurado para manejar ambos conjuntos de cuentas (es decir de contabilidad y presupuestales) requerido en virtud de las leyes mexicanas.  Normalmente, desde la perspectiva de la diligencia debida, dos conjuntos de libros contables presentarían una causa para preocuparse, pero México tiene un propósito en dividir las cuentas en dicha manera.  Un lado es la contabilidad financiera tradicional realizada sobre una base devengada de emparejar los ritmos de los ingresos y gastos. El otro es un sistema para seguir los flujos de efectivo para asegurar la solvencia y la liquidez de la tesorería.

De otro lado, CIDESI cuenta ahora con un sistema de gestión de proyectos de alto precio en el E.P.M., que se está implementando.  El énfasis del E.P.M. se centra menos en contabilidad y más hacia la asignación de recursos y el aprendizaje organizacional.  Su Centro ha apostado para una creativa, si temporal, esquizofrenia más bien que una integración inmediata entre dos sistemas muy diferentes, con fines divergentes y con base en la programación incompatible.  Por tanto, el E.P.M. es una parte de la Dirección General de Operaciones mientras que BAAN se queda en T.I.C.

¡Qué camino a seguir!
Este modus vivendi no durará cuando las funciones se superponen y personalidades salen a la palestra.  Así, ¿qué se puede hacer? En servir fielmente como el tonto de pueblo durante los últimos tres años, he llegado a conocer bien este Centro. Una creencia cierta que tengo es que el Departamento de T.I.C. es demasiado grande, con veinticinco personas para menos de cuatrocientas personas a través de su Centro. En virtud de su tamaño y presupuesto, T.I.C. no debería tener más de entre ocho y doce profesionales. Es decir, sencillamente: es demasiado centralizado.

De hecho, las funciones de la administración de información y conocimientos deben dividirse para evitar la confusión entre datos y conocimientos; información y aprendizaje. Por tanto, entre trece y diecisiete de las profesionales dentro de T.I.C. se deben reasignar a las Direcciones operativas, gerencia general y administración.  Además, tales individuos reasignados deben estar debajo de la supervisión conjunta de la nueva división, así como a la Dirección de Operaciones (E.P.M.) y a T.I.C. (BAAN). Ellos, entonces, serán los mediadores humanos entre los dos sistemas.

Dichos expertos asumirían cuatro funciones con un rico contenido de trabajo:
  • agentes de conocimientos capaces de resolver problemas técnicos para sus divisiones respectivas;
  • espontáneos nodos de red para el flujo libre de las ideas y sugerencias a través del Centro; así como,
  • una fuente contingente de apoyo auxiliar.

¡Ay buena pena!...¿Qué paso adelante?
Sin embargo, cada ‘gran salto adelante’ (Hola, Mao Tse-tung…¡otra vez!) comienza con un mero paso.  Así, ¿qué paso puede ser esto? La señal dominante tendría que aclarar que su Centro ya no está anclado en la jerarquía del pasado pero ahora está surgiendo como una incubadora de vanguardia de innovación.  Este paso simbólico tendría que ser fácil a realizar para impulsar a ustedes hacia una transformación cultural. Tal paso revolucionario tendría que enfatizar el panorama al largo plazo sobre control diario. Al final, caminar como esto tendría que inducir a los valientes entre ustedes a integrar ideas divergentes y especulativas.  Yo digo 'valientes'  porque, como discutido hace ocho meses exactamente (http://articulosdeneddy.blogspot.mx/2013/03/cidesi-articles-for-march-15th.html), los visionarios a menudo despiertan la envidia de los seres inferiores.

Y, sí, hay un paso que su Centro puede tomar  – aquí y ahora – que vaya a lograr todas estas ambiciones enumeradas antes fácilmente, rápido e indeleblemente.

Eso sería la terminación inmediata del seguimiento todo el día, cada día, de los movimientos de los profesionales por medio del uso de sus credenciales. Esta política no solo trata a los empleados como niños que no se puede confiar, sino este control les dice que ellos – y sus mentes – son meras materias primas. Los niños pueden soñar, pero no puedan innovar; las materias primas pueden alcanzar un precio en el mercado, pero nunca añadan valor.

Les guste o no, la innovación es un asunto confuso de prueba y error, a menudo emergiendo del tiempo libre, pasando en tomar un capuchino con otros de disciplinas ajenas en un área común dedicada para descansar. Si su Centro, o cualquier lugar, tiene suerte, una idea, tal vez dos, pueda surgir cada dos o tres años para hacer todos los previos errores – ahora embebidas en la nueva idea beneficiosa –  todas las molestias menores y desperdicio evidente vale la pena. Finalmente, en nuestra época de ‘BIG DATA’ en poco tiempo, su desafío clave no es tan mucho cuál tecnología para usarse pero cuando se debe usarla.

Que todos tengan una buen y largo fin-de-semana.

La carta para la semana que viene se ha cancelado para conmemorar el asesinato del presidente Kennedy en 1963. La última carta en esta serie se distribuirá el viernes el 29 de noviembre. Gracias.

Gracias y saludos,
Ned
Edward J. McDonnell  III, CFA
Peace Corps-México
USMX.:  860-690-1740
SKYPE: nedmcd3
CONACYT, I.P.N. y CIENCIA
Resumen de los diez otros (10) artículos semanales
CONACYT et al.: nano-pioneros ESP; COL-mec; nano-tec viene a Valencia; nano-cumbre en B.A.; nano-bio ESP; Lufthansa darle gracias el ingeniero principal del jet ‘747’; nano-cumbre en PER; un 17% más para las ciencias MX; hasta de USD 200 millones de recortes para universidades MX
R & D + i: nuevo adhesivo aeronáutico; tecnología y textiles en AC; mecatrónica en Veracruz; H.P. colaborando con Nanum Nanotecnología; reflexiones sobre nano-ciencia; aquí viene Rolls Royce en 3-D
AERONÁUTICAS
Resumen de doce otros (12) artículos semanales
Países Ibéricos: CHL movilizándose por paz; cohete ARG listo; ESP preparando satélite; nueva escuela de aviación HON; MX necesita planeación nacional
Inteligencia Competitiva: nuevo líder del aero-clúster en AND; aero-expo en UAE los 17-19 de noviembre con 20 empresas rusas; ESP probando drones; 3° Sukhoi-100 para InterJet; buenas pruebas por Airbus; empresa B.C. logra NADCAP; empresa ESP mejor proveedor a Embraer; EADS eliminando empleos; pedidos pronosticados por Airbus más de 1.200 en 2013
Otras Noticias: pequeño problema 787 JAP; Boeing probando el jet 787-9; satélites PER; Abertis comprando el 17% del Hispasat por MXN 3.000 millones; estación internacional atacada por virus informático; caer JAP; ¿Hyundai o Kia sobre la Luna?
TECNOVACIÓN AMERICANA, ENERGÏA y AUTOMOTRIZ
Resumen de trece otros (13) artículos semanales
MÉXICO et al.: innovaciones en TIC; 10 tips por Jack Dorsey; ¿demasiada privacidad deseada BRA?; incubadora N.L.; MIT+ESP=T.T.; PyME puede pensar grande
Energía: POL y carbón; dilema de privatización MX; escasez costosa de gas natural MX; riesgos renovables; CHI en PER;
Automotriz: secreto de éxito CdS; ¿Hyundai o BMW en Bajío?; GM mueve su oficina de CHI a Singapur; Bosch et al. en JAL (¿Jalemania?); crecimiento automotriz por un 20% en CHI octubre
Querétaro, Dirección General, etc.
(población estatal de dos millones)
Resumen de trece otros (13) otros artículos semanales
Inteligencia competitiva: mecatrónica en SON; desempleo de un 6% en COA; ¿Mitsu-bishi con Boeing para alas del jet-777?; riesgos de BIG-DATA; microcréditos en EUR; D.F. ama a Chicago
QUERÉTARO: colaboración con OnStar; ITESM y GM colaborar; inversiones incrementando por 21% en 2013; QRO no progresando sobre cadena de valor; tal vez un aero-centro en 2014; incubadoras floreciendo
Dirección General: vigilancia en ARG; CHI crecimiento un 7%; F.A.R.C. rechazadas; peligros en LatAm; BMV cayendo con compras por consumidores en MX; MX ralentización en nuevos empleos MX por 75 mil en trimestre; declive de construcción MX por el 8%; economía misterio CHI; deceleración en EuroZona; CdS tiene ‘soul’; fracaso de las viejas recetas económicas; violencia MX consumiendo un 1.3% del PIB
===================

The Rise of Big-Data

El aumento de los ‘InfiniDatos’

FOREIGN AFFAIRS: Focus; Cukier, Kenneth Neil and Mayer-Schoenberger, Viktor; mayo-junio 2013
Big data starts with the fact that there is a lot more information floating around these days than ever before, and it is being put to extraordinary new uses. Big data is distinct from the Internet, although the Web makes it much easier to collect and share data. Big data is about more than just communication: the idea is that we can learn from a large body of information what we could not comprehend when we used only smaller amounts.

Grandes datos (Big Data) se inician con el hecho de que hay mucha más información flotando alrededor en estos días. Ellos se están poniendo a los nuevos usos extraordinarios. Big Data son distintos de la inter-net, aunque la net hace mucho más fácil de recoger y compartir tales datos. Big Data son sobre más que apenas la comunicación: la idea es que podemos aprender de un gran cuerpo de información de lo que no podíamos comprender con cantidades más pequeñas en años pasados.


The explosion of data is relatively new. As recently as the year 2000, only one-quarter of all the world’s stored information was digital. The rest was preserved on paper, film, and other analog media. But because the amount of digital data expands so quickly -- doubling around every three years -- that situation was swiftly inverted. Today, less than two percent of all stored information is non-digital.

La explosión de datos es nueva. En 2000, sólo una cuarta parte de toda la información almacenada en el mundo era digital. El resto se conservó en papel, el cine y otros medios analógicos. Pero debido a la cantidad de datos digitales que ha expandido tan rápidamente - duplicándose cada tres años - esa situación cambió rápidamente. Hoy en día, menos de 2% de toda la información almacenada no es digital.


Given this massive scale, it is tempting to understand big data solely in terms of size. But that would be misleading. Big data is also characterized by the ability to change into data many aspects of the world that have never been quantified before; call it “datafication.” For example, location has been datafied, first with the invention of longitude and latitude, and more recently with GPS satellite systems. Words are treated as data when computers mine centuries’ worth of books. Even friendships and “likes” are datafied, via Facebook.

Dada esta escala, se tiene la tentación de comprender big data exclusivamente en términos de tamaño. Pero eso sería engañoso. Big data también se caracterizan por la capacidad de transformar muchos aspectos del mundo dentro de nuevos datos que no han sido cuantificados antes. Se puede llamarlo "dataficación." Por ejemplo, el posicionamiento  se ha 'dataficado', primero con la invención de longitud y latitud, y más recientemente con los sistemas de satélites de GPS. Las palabras se tratan como datos cuando los ordenadores recorren siglos de libros. Incluso las amistades y "likes" se 'datafican', a través de Facebook.


This kind of data is being put to incredible new uses with the assistance of inexpensive computer memory, powerful processors, smart algorithms, clever software, and math that borrows from basic statistics. Instead of trying to “teach” a computer how to do things, such as drive a car or translate between languages, which artificial-intelligence experts have tried unsuccessfully to do for decades, the new approach is to feed enough data into a computer so that it can infer the probability that, say, a traffic light is green and not red or that, in a certain context, lumière is a more appropriate substitute for “light” than léger.

Este tipo de datos se está poniendo a los nuevos usos increíbles con la ayuda de la memoria del ordenador barata, potentes procesadores, algoritmos inteligentes, software inteligente, y matemáticas que se basan en las estadísticas básicas. En lugar de tratar de "enseñar" a una computadora cómo hacer las cosas, como conducir un automóvil o traducir entre idiomas -- una tarea que los expertos de inteligencia artificial han intentado sin éxito hacer por décadas, el nuevo enfoque es alimentar suficientes datos en una computadora para que se puede inferir la probabilidad de que, por ejemplo, un semáforo está en verde y no en rojo, o que, en cierto sentido, lumière es un sustituto más adecuado que léger para la "luz".


Using great volumes of information in this way requires three profound changes in how we approach data. The first is to collect and use a lot of data rather than settle for small amounts or samples, as statisticians have done for well over a century. The second is to shed our preference for highly curated and pristine data and instead accept messiness: in an increasing number of situations, a bit of inaccuracy can be tolerated, because the benefits of using vastly more data of variable quality outweigh the costs of using smaller amounts of very exact data. Third, in many instances, we will need to give up our quest to discover the cause of things, in return for accepting correlations. With big data, instead of trying to understand precisely why an engine breaks down or why a drug’s side effect disappears, researchers can instead collect and analyze massive quantities of information about such events and everything that is associated with them, looking for patterns that might help predict future occurrences. Big data helps answer what, not why, and often that’s good enough.

La aplicación de grandes volúmenes de información de esta manera requiere tres cambios profundos en la forma en que nos acercamos a los datos. La primera consiste en recopilar y utilizar una gran cantidad de datos en lugar de conformarse con pequeñas cantidades o conjuntos, como los estadísticos han hecho por más de un siglo. La segunda es dejar de  nuestra preferencia por los datos muy precisos y prístinos. En cambio, debemos aceptar desorden: en un número cada vez mayor de situaciones, un poco de falta de precisión puede ser tolerada, ya que los beneficios de usar mucho más datos de calidad variable son mayores que los costos de la utilización de menores cantidades de datos muy exactos. En tercer lugar, en muchos casos, tendremos que abandonar nuestra búsqueda para descubrir la causa de las cosas, a cambio de la aceptación de las correlaciones. Con big data, en lugar de tratar de entender exactamente porqué un motor se rompe o porqué efecto secundario de una droga aparece, los investigadores pueden recolectar y analizar cantidades masivas de información sobre este tipo de eventos y todo lo que se asocia con ellos, en busca de patrones que podrían ayudar a predecir los acontecimientos futuros. Big data ayudan a responder a lo que, no es por eso. Muchas veces eso es suficiente.
APPROACHING "N=ALL"

ACERCÁNDOSE hacia ‘N=TODO’
Modern sampling is based on the idea that, within a certain margin of error, one can infer something about the total population from a small subset, as long the sample is chosen at random. When there was not that much data around, researchers had to make sure that the figures they bothered to collect were as exact as possible. Tapping vastly more data means that we can now allow some inaccuracies to slip in (provided the data set is not completely incorrect).

La toma de muestras moderna se basa en la idea de que, dentro de un cierto margen de error, se puede inferir algo acerca de la población total de un pequeño grupo, mientras que el conjunto se elige al azar. Cuando no había que muchos datos fácilmente disponibles, los investigadores tenían que asegurarse que dichos pocos datos recogidos eran tan exactas como sea posible. Aprovecharnos de mucho más datos significa que ahora podemos permitir que algunos errores (siempre que el conjunto de datos no sea totalmente falso).


FROM CAUSATION TO CORRELATION

DESDE CAUSA HACIA CORELACIÖN
These two shifts in how we think about data -- from some to all and from clean to messy -- give rise to a third change: from causation to correlation. This represents a move away from always trying to understand the deeper reasons behind how the world works to simply learning about an association among phenomena and using that to get things done.

Estos dos cambios en la forma en que pensamos acerca de los datos - desde algunos a todos, así como desde limpio a sucio - dan lugar a un tercer cambio: desde la causalidad hacia la correlación. Esto representa un alejamiento de siempre tratar de comprender las razones profundas detrás de cómo funciona el mundo, en favor de percibir una asociación entre los fenómenos y su utilidad en hacer cosas.


Medicine provides another good example of why, with big data, seeing correlations can be enormously valuable, even when the underlying causes remain obscure. In February 2009, Google created a stir in health-care circles. Researchers at the company published a paper that showed how it was possible to track outbreaks of the seasonal flu using nothing more than the archived records of Google searches. Google handles more than a billion searches in the United States every day and stores them all. The company took the 50 million most commonly searched terms between 2003 and 2008 and compared them against historical influenza data from the Centers for Disease Control and Prevention. The idea was to discover whether the incidence of certain searches coincided with outbreaks of the flu -- in other words, to see whether an increase in the frequency of certain Google searches conducted in a particular geographic area correlated with the CDC’s data on outbreaks of flu there. The CDC tracks actual patient visits to hospitals and clinics across the country, but the information it releases suffers from a reporting lag of a week or two -- an eternity in the case of a pandemic. Google’s system, by contrast, would work in near-real time.

Medicina es otro buen ejemplo de por qué, con big data, viendo las correlaciones pueden ser de gran valor, incluso cuando las causas subyacentes siguen siendo oscuros. En febrero de 2009, Google creó un revuelo en los círculos de salud. Los investigadores de la compañía publicaron un documento que mostraba cómo era posible seguir los brotes de la gripe estacional usando nada más que los registros archivados de las búsquedas mediante Google. Google maneja más de mil millones de búsquedas en Estados Unidos todos los días y almacena todas. La compañía tomó los 50 millones de términos más buscados entre los años 2003 y 2008 y los compararon con los datos históricos sobre la gripe de los Centros para el Control y Prevención de Enfermedades (el C.D.C.). La idea era descubrir si la incidencia de determinadas búsquedas coincidió con los brotes de la gripe - en otras palabras, para ver si un incremento en la frecuencia de ciertas búsquedas mediante Google, realizadas en una zona geográfica determinada, era relacionado con los datos del C.D.C. sobre los brotes de la gripe en las mismas áreas. El C.D.C. registra las visitas reales de pacientes a los hospitales y clínicas de todo el país, pero la información diseminada sufre de un retraso de la notificación de una semana o dos - una eternidad en el caso de una pandemia. El sistema de Google, por el contrario, iba a funcionar casi en tiempo real.


Google did not presume to know which queries would prove to be the best indicators. Instead, it ran all the terms through an algorithm that ranked how well they correlated with flu outbreaks. Then, the system tried combining the terms to see if that improved the model. Finally, after running nearly half a billion calculations against the data, Google identified 45 terms -- words such as “headache” and “runny nose” -- that had a strong correlation with the CDC’s data on flu outbreaks.  Moreover, the data were imperfect. But the sheer size of the data set more than compensated for its messiness. The result, of course, was simply a correlation.

Google no había pretendido saber cuáles términos de búsqueda serían los mejores indicadores. En su lugar, corrieron todos los términos a través de un algoritmo que clasificaban los datos por nivel  de correlación con los brotes de gripe. A continuación, el sistema ha intentado combinar los términos para ver si eso mejoraría el modelo. Finalmente, después de correr casi quinientos millones de cálculos con respecto a datos, Google identificó 45 términos - palabras como "dolor de cabeza" y "flujo nasal" - que tuvieron una fuerte correlación con los datos del C.D.C. sobre los brotes de gripe. Por otra parte, los datos eran imperfectos. Sin embargo, el tamaño del conjunto de datos más que compensado por su desorden. El resultado, por supuesto, era una mera correlación.


BACK-END OPERATIONS

OPERACIONES POR ATRÁS (de back-end)
There will be a special need to carve out a place for the human: to reserve space for intuition, common sense, and serendipity.  There is no good term yet for this sort of transformation, but “datafication” seems apt. Once we datafy things, we can transform their purpose and turn the information into new forms of value.

Habrá una especial necesidad de integrar el ser humano: para reservar espacio para la intuición, el sentido común, y la casualidad. No hay un buen término, sin embargo, para este tipo de transformación, pero "dataficación" parece bien. Una vez que 'dataficamos' cosas, podemos transformar su propósito y convertir la información en nuevas formas de valor.


For example, IBM was granted a U.S. patent in 2012 for “securing premises using surface-based computing technology” -- a technical way of describing a touch-sensitive floor covering, somewhat like a giant smartphone screen. Once it becomes possible to turn activities of this kind into data that can be stored and analyzed, we can learn more about the world -- things we could never know before because we could not measure them easily and cheaply.

Por ejemplo, I.B.M. obtuvo una patente en 2012 para "asegurar las instalaciones que utilizan la tecnología informática basada en la superficie" - una forma técnica de describir una baja sensible al tacto que cubre, similar en concepto a una pantalla del smartphone gigante. Una vez que se hace posible a su vez las actividades de este tipo en datos que pueden ser almacenados y analizados, podremos aprender más sobre el mundo - cosas que nunca podríamos saber antes porque no hemos podido medirlas con facilidad ya bajo costo.


BIG DATA IN THE BIG APPLE

BIG DATA en la GRAN MANZANA (New York)
Big data will have implications far beyond medicine and consumer goods: it will profoundly change how governments work and alter the nature of politics. When it comes to generating economic growth, providing public services, or fighting wars, those who can harness big data effectively will enjoy a significant edge over others. So far, the most exciting work is happening at the municipal level, where it is easier to access data and to experiment with the information. In an effort spearheaded by New York City Mayor Michael Bloomberg (who made a fortune in the data business), the city is using big data to improve public services and lower costs. One example is a new fire-prevention strategy.

Big data tendrán implicaciones más allá de la medicina y de bienes de consumo: se cambiará profundamente cómo funcionan los gobiernos y alterar la naturaleza de las políticas. Cuando se trata de generar crecimiento económico, la prestación de servicios públicos, o guerras, aquellos que pueden aprovecharse de los grandes datos efectivamente van a disfrutar de una ventaja significativa sobre los demás. Hasta ahora, el trabajo más emocionante está sucediendo a nivel municipal, donde es más fácil acceder a los datos y para experimentar con la información. En un esfuerzo liderado por el alcalde de Nueva York Michael Bloomberg (quien hizo una fortuna financiera en los negocios de datos), la ciudad se está utilizando big data para mejorar los servicios públicos y reducir los costos. Un ejemplo es una nueva estrategia de prevención de incendios.


Illegally subdivided buildings are far more likely than other buildings to go up in flames. The city gets 25,000 complaints about overcrowded buildings a year, but it has only 200 inspectors to respond. A small team of analytics specialists in the mayor’s office reckoned that big data could help resolve this imbalance between needs and resources. The team created a database of all 900,000 buildings in the city and augmented it with troves of data collected by 19 city agencies. That correlative knowledge has proved immensely valuable: in the past, building inspectors issued vacate orders in 13 percent of their visits; using the new method, that figure rose to 70 percent -- a huge efficiency gain.

Edificios ilegalmente subdivididos son mucho más propensos que otros edificios para incendiarse. La ciudad recibe 25.000 quejas sobre edificios superpoblados por año, pero sólo tiene 200 inspectores para responder. Un pequeño equipo de especialistas en análisis en la oficina del alcalde creía que grandes volúmenes de datos pudieran ayudarles a resolver este desequilibrio entre las necesidades y los recursos. El equipo creó una base de datos de todos los 900.000 edificios de la ciudad y lo amplió con montones de datos recolectados por 19 agencias de la ciudad. Ese conocimiento correlacionado ha sido inmensamente valioso: en el pasado, inspectores de la construcción emitió órdenes de desalojo en el 13% de sus visitas, con el nuevo método, la cifra se elevó a 70% - una mejora de eficiencia enorme.


Big data is also helping increase the transparency of democratic governance. A movement has grown up around the idea of “open data,” which goes beyond the freedom-of-information laws that are now common in developed democracies. Supporters call on governments to make vast amounts of data that they hold easily available to the public. The United States has been at the forefront and many other countries have followed.

Big data también están ayudando aumentar la transparencia de la gobernanza democrática. Un movimiento ha crecido en torno a la idea de "datos abiertos", que va más allá de las leyes de libertad de información que ahora sean trillados en las democracias desarrolladas. Los partidarios llaman a los gobiernos a tomar grandes cantidades de datos inofensivos para hacerlos a fácil acceso al público. Los Estados Unidos han estado a la vanguardia y muchos otros países han seguido.


BIG DATA OR BIG BROTHER?

¿BIG DATA o HERMANO DICTADOR?
States will need to help protect their citizens and their markets from new vulnerabilities caused by big data. But there is another potential dark side: big data could become Big Brother. In all countries, but particularly in nondemocratic ones, big data exacerbates the existing asymmetry of power between the state and the people.  Perhaps such systems would identify which young people are most likely to shoplift. There might be decent reasons to get so specific, especially when it comes to preventing negative social outcomes other than crime.

Los Estados tendrán que ayudar a proteger a sus ciudadanos y sus mercados contra nuevas vulnerabilidades causadas por big data. Pero hay otra posibilidad de un lado oscuro: big data pueden convertirse en el hermano dictador. En todos los países, pero especialmente en los no democráticos, big data agravan la asimetría de poder existente entre el Estado y los gobernados. Tal vez tales sistemas se identifican cuáles jóvenes son más propensos a robar en tiendas. Puede haber razones de llegar tan específico, sobre todo cuando se trata de prevenir los resultados sociales negativos pero no criminales.


For example, if social workers could tell with 95 percent accuracy which teenage girls would get pregnant or which high school boys would drop out of school, wouldn’t they be remiss if they did not step in to help? It sounds tempting. Prevention is better than punishment, after all. But even an intervention that did not admonish and instead provided assistance could be construed as a penalty -- at the very least, one might be stigmatized in the eyes of others. In this case, the state’s actions would take the form of a penalty before any act were committed, obliterating the idea of free will.

Por ejemplo, si los trabajadores sociales pueden contar con un 95% de precisión qué señoritas adolescentes podrían quedarse embarazadas, o cuáles chicos de secundaria se retirarían de la escuela, ¿serían negligentes los trabajadores sociales si no intervienen para ayudar? Suena tentador. La prevención es mejor que el castigo, sin duda. Sin embargo, incluso una intervención servicial podría interpretarse como una sanción - por lo menos, uno podría ser estigmatizado a los ojos de los demás. En este caso, las acciones del Estado tomaría la forma de un penal antes de la comisión de ningún acto, destruyendo la santidad de libre voluntad.


This misplaced trust in data can come back to bite. Organizations can be beguiled by data’s false charms and endow more meaning to the numbers than they deserve. The figures are frequently inaccurate and were of little value as a way to measure success. Although it is important to learn from data to improve lives, common sense must be permitted to override the spreadsheets. A worldview built on the importance of causation is being challenged by a preponderance of correlations.

Esta fe ingenua en los datos puede volver a mordernos. Las organizaciones pueden ser engañadas por los falsos encantos de datos y confieren más sentido a los números que existe dentro de ellos. Las cifras son frecuentemente inexactas y de poco valor como una manera de medir el éxito. Si bien es importante aprender de los datos para mejorar la vida, el sentido común debe permitir superarse a las hojas de cálculo. Una visión del mundo basada en la importancia de la causalidad está siendo desafiada por una preponderancia de las correlaciones.
KENNETH CUKIER is Data Editor of The Economist. VIKTOR MAYER-SCHOENBERGER is Professor of Internet Governance and Regulation at the Oxford Internet Institute. They are the authors of Big Data: A Revolution That Will Transform How We Live, Work, and Think (Houghton Mifflin Harcourt, 2013), from which this essay is adapted.



BIG-DATAs’ Little Brother

Micro-datos del Gran Hermano
The NEW YORK TIMES; Hardy, Quentin;  el 11 de noviembre 2013
SAN FRANCISCO — David Soloff is recruiting an army of “hyperdata” collectors. The company he co-founded, Premise, created a smartphone application that is now used by 700 people in 25 developing countries. Using guidance from Mr. Soloff and his co-workers, these people, mostly college students and homemakers, photograph food and goods in public markets. By analyzing the photos of prices and the placement of everyday items like piles of tomatoes and bottles of shampoo and matching that to other data, Premise is building a real-time inflation index to sell to companies and Wall Street traders, who are hungry for insightful data.

El Valle de Silicio: el Sr. David Soloff está reclutando un cuerpo de excavadores de ‘híper-datos’. El fundador de ‘Premise’ ha creado una aplicación para ‘inteléfonos’ (es decir, smartphones) usada por siete cientos personas en veinticinco países emergentes. Con la guía del equipo de Soloff, dichos excavadores (principalmente estudiantes universitarias y madres de casa) toman fotos en mercados públicos. Por analizar esas fotos del emplazamiento y el precio de consumibles (por ejemplo, tomates o champú) para comparar con otros datos, Premise está creando un índice de inflación en tiempo real. La empresa luego vende sus hallazgos a empresas privados, inversionistas et al. que buscan tales datos diariamente.



Collecting data from all sorts of odd places and analyzing it much faster than was possible even a couple of years ago has become one of the hottest areas of the technology industry. The idea is simple: With all that processing power and a little creativity, researchers should be able to find novel patterns and relationships among different kinds of information. Now Big Data is evolving, becoming more “hyper” and including all sorts of sources. Start-ups as well as larger companies are getting into the act. And the faster that happens, the better, so people can make smart — and quick — decisions.

En extraer datos desde todo tipo de rara fuente para analizarlos mucho más rápido que fue posible hace dos años, estos excavadores representan un sector de vanguardia tecnológico. La idea es sencilla.  Con todos esos datos, junto con una poca creatividad, investigadores deberían averiguar nuevas relaciones entre información divergente. Ahora, los BIG-DATA se están volviendo cada vez más 'híper' mediante diversas fuentes no aprovechadas anteriormente.  Los start-ups, como Premise, y gigantes, como G.E., están entrando la arena cada vez más competitiva. El más rápido, el mejor para que se puede tomar inteligentes decisiones rápidas.



Standard statistics might project next summer’s ice cream sales. The aim of people working on newer Big Data systems is to collect seemingly unconnected information like today’s heat and cloud cover, and a team’s week-end win, compare that with past weather and sports outcomes, and figure out how much mint chip ice cream mothers would buy today. At least, that is the hope, and there are early signs it could work. Premise claims to have spotted broad national inflation in India months ahead of the government.

Las estadísticas tradicionales pueden pronosticar las ventas de helado el verano que viene. La excavación de datos pretende integrar información recogida sin enlaces visibles. Por ejemplo, los híper-datos podrían intentar alinear el clima de hoy, la presencia relativa de nubes, resultados locales deportivos recientes con tales datos históricos para cuantificar cuánto helado, de sabor regional, madres van a comprar ahora. Hay señales preliminares que esta esperanza pueda realizarse. Premise dice que había detectado inflación en India meses antes del gobierno.



Price data from the photos gets blended with prices Premise receives from 30,000 websites. The company then builds national inflation indexes and price maps for markets in places like Kolkata, India; Shanghai; and Rio de Janeiro.  The new Big Data connections are also benefiting from the increasing amount of public information that is available. According to research from the McKinsey Global Institute, 40 national governments now offer data on matters like population and land use. The United States government alone has 90,000 sets of open data. In the world of computer hardware, in-memory computing, an advance that allows data to be crunched, without being stored in a different location, has increased computing speeds immensely.

Los datos de precios extraídos de las fotos se integran con otros precios recopilados desde 30.000 sitios-web. Luego, el start-up elabora índices nacionales de inflación y mapas de precios para tales mercados diversos como Río de Janeiro, Calcuta y Shanghái. Dichas excavaciones se benefician de la creciente disponibilidad de datos públicos. Según McKinsey, México y treinta-y-nueve otros países hacen accesible información sobres cosas como el uso de la tierra o cambios de población. Los U.S.A. tienen noventa mil bases de datos abiertos al público. Gracias a nuevo hardware con memoria informática, que permite análisis de datos sin necesidad de almacenamiento exterior, velocidades de computación han ampliado casi sin límite.  Ahora, se puede analizar minuciosamente una piscina profunda de datos instantáneamente. 



G.E. has over 200 sensors in a single jet engine and is working with Accenture to build a business analyzing aircraft performance the moment the jet lands. G.E. also has software that looks at data collected from 100 places on a turbine every second, and combines it with power demand, weather forecasts and labor costs to plot maintenance schedules. New hardware and software have been created to sharply cut the time to analyze unsystematically generated information, fetching it as fast as an iPhone fetches a song.

Por ejemplo en las aeronáuticas, G.E. tiene más de doscientos sensores dentro un motor de turbina. Está colaborando con Accenture (una consultora) para establecer una empresa para analizar el desempeño de un jet acabo de aterrizar.  G.E. tiene otro software para agregar datos de cien lugares dentro del motor cada segundo para integrarlos con pronósticos de la clima y costos laborales para programar mantenimiento. Nuevos avances reducen el tiempo de analizar información casi aleatoria tan rápido como un ‘inteléfono’ obtiene una canción.



Last month, creators an open-source software, which speeds data analysis by 100 times compared with existing systems, received $14 million to start a company that would offer a commercial version of that software. The trick said the CEO of another instant data dumper was developing a way to quickly and accurately find all of the data sources available.

El mes pasado, un nuevo software con plataforma abierta que acelera el análisis de datos por cien veces, recibió 175 millones de pesos para comercializar su prototipo.  Según otro descargador de información instantáneo, el secreto será la identificación de un método eficaz para encontrar todas las fuentes de datos precisamente y rápido.  Se ayudaría el esfuerzo para presentar esos datos aleatorios en un formato fácil de usar.



The do-or-die questions boards should ask about technology: Board members should raise nine critical questions when discussing technology strategy with IT and business managers
Las preguntas críticas (‘do-or-die’) para pensar en la tecnología: La Junta debe plantear nueve preguntas críticas cuando se habla de estrategia de tecnología gerentes pertinentes
McKINSEY & CO.: Insights and Publications; Wilmott, Paul; junio 2013
The particulars of each enterprise’s situation will, of course, determine the focus of the discussion and the detailed questions to ask. However, across industries, every corporate director—IT savvy or not—will benefit from reviewing the following questions as a starting point for shaping a fruitful conversation with management about what the company needs to do to become a technology winner.

Los detalles de la situación de cada empresa, por supuesto, determinan el foco de la discusión y las preguntas específicas para hacer. Sin embargo, en todos los sectores, cada director corporativo, ya sea o no informado acerca de la informática, se beneficiará de la revisión de las siguientes preguntas como punto de partida para dar forma a un debate constructivo con la administración sobre lo que la empresa tiene que hacer para convertirse en un ganador en la I.T.


1. How will IT change the basis of competition in our industry?

1. ¿Cómo va a cambiar la naturaleza de la competencia en nuestra industria?
Technology is making boundaries between industries more porous and providing opportunities for attacker models. Companies are harnessing technologies such as social media and location-based services to reinvent the customer experience and capture market share.

La tecnología hace más porosas las fronteras entre las industrias para generar oportunidades para los modos de ataque competitivo. Las empresas están aprovechando de las tecnologías como las redes sociales y los servicios basados en la localización para reinventar la experiencia del cliente y capturar más cuota de mercado.
Question(s) to ask: How is technology helping us win against traditional and new competitors?

Pregunta(s) a plantear: ¿Cómo está la tecnología ayudándonos a ganar frente a los competidores tradicionales y las nuevas llegadas?


2. What will it take to exceed our customers’ expectations in a digital world?

2. ¿Qué se necesita para superar las expectativas de nuestros clientes en un mundo digital?
Customer expectations are rising quickly. Simply meeting these enhanced expectations can be a major effort for organizations that were not born digital. Often, doing so requires investment in sophisticated big-data capabilities.

Las expectativas del cliente están aumentando rápido. El mero cumplimiento de estas expectativas elevadas puede ser duro esfuerzo para las organizaciones que no habían nacido digitalmente. A menudo, esto requiere inversión en capacidades avanzadas de grandes datos.
Question(s) to ask: What will our customers expect in the future, and what will it take to exceed them?

Pregunta(s) a plantear: ¿Qué son las expectativas de nuestros clientes del futuro, y lo que se necesita para satisfacerlos?


3. Do our business plans reflect the full potential of technology to improve our performance?

3. ¿Reflejan nuestros planes de negocio la posibilidad de tecnología para mejorar el rendimiento?
Technology can improve business performance by driving revenues (for example, by using big data for cross-selling in digital channels), reducing overall costs (for instance, by automating end-to-end processes), and lowering risk costs.

La tecnología puede mejorar el rendimiento del negocio mediante las ventas (por ejemplo, mediante el uso de datos grandes, 'Big Data', para las ventas cruzadas a través de canales digitales) mediante la reducción de los costes totales (por ejemplo, por la automatización de procesos de extremo a extremo) y reduciendo los riesgos.
Question(s) to ask: Has the opportunity and threat from IT been quantified by application?

Pregunta(s) a plantear: ¿se ha cuantificado  la oportunidad y la amenaza de la aplicación de la T.I?


4. Is our portfolio of technology investments aligned with opportunities and threats?

4. ¿Es nuestra cartera de inversiones en tecnología alineada con las oportunidades y amenazas?
Companies should balance short-term P&L opportunities (for example, upgrading digital channels), medium-term platform investments (such as customer databases), and carefully chosen longer-term bets (for instance, piloting new, digitally enabled business models).

Las empresas deben equilibrar las oportunidades a corto plazo (por ejemplo, la actualización de canales digitales), inversiones a medio plazo en infraestructura (tales como bases de datos de clientes), y cuidadosamente elegido apuestas a largo plazo (por ejemplo, ensayar nuevos modelos de negocio, habilitados digitalmente).
Question(s) to ask: How well is our IT-investment portfolio aligned with business value?

Pregunta(s) a plantear: ¿En qué medida se alinea nuestra cartera de inversiones informáticas con el valor del negocio?


5. How will IT improve our operational and strategic agility?

5. ¿Cómo va la T.I. a mejorar nuestra agilidad operativa y estratégica?
IT has a significant effect on operational agility (for example, time to market for new products) and on strategic business agility (for instance, the ability to extract synergies from an acquired business). Businesses measure and manage both business and IT agility, ensuring that the business can respond competitively.

La T.I. tiene un efecto significativo en la agilidad operativa (por ejemplo, el tiempo de comercialización de nuevos productos) y en la agilidad estratégica de negocios (por ejemplo, la posibilidad de lograr sinergias en una empresa adquirida). Las empresas medir y gestionar el negocio, junto con la agilidad en T.I., para garantizar que la empresa pueda responder.
Question(s) to ask: Do sourcing relationships increase or reduce our agility?

Pregunta(s) a plantear: ¿Qué es el impacto sobre relaciones de la cadena de suministro?


6. Do we have the capabilities required to deliver value from IT?

6. ¿Tenemos las capacidades necesarias para ofrecer un valor de la T.I.?
Technology alone delivers no value. It’s the combination of a clear strategy, the right technology, high-quality data, appropriate skills, and lean processes that adds up to create value. Leading organizations actively assess their capabilities in these dimensions and target their weak spots. Some companies have put their top managers through IT boot camp as a way to start the process.

Tecnología en sí misma ofrece ningún valor. Es la combinación de una estrategia clara, con la tecnología adecuada, los datos de alta calidad, las habilidades apropiadas y procesos flexibles que crea el valor. Las organizaciones líderes evalúan activamente sus capacidades en estas dimensiones y se dirigen a sus puntos débiles. Algunas empresas han puesto a sus altos ejecutivos en un 'Boot Camp' informático como una manera de iniciar el proceso.
Question(s) to ask: Do we have enough IT-literate executives?

Pregunta(s) a plantear: ¿Tenemos suficientes ejecutivos que entienden la T.I.C.?


7. Who is accountable for IT and how do we hold them to account?

7. ¿Quiénes son responsables de TI y cómo podemos hacer que rindan cuentas?
Accountability for IT is not always so well-defined.  IT can also prove hard to measure. All too often, volumes of technical data are presented instead of a limited set of intuitive, business-relevant metrics.

La responsabilidad de que no es siempre tan bien definido. También se puede resultar difícil de medir. Con demasiada frecuencia, un montón de datos técnicos se presenta en lugar de un conjunto limitado de indicadores intuitivos que son relevantes para la toma de decisiones.
Question(s) to ask: What is our operating model for IT, and is it aligned with our business priorities?

Pregunta(s) a plantear: ¿Cuál es nuestro modelo informático? ¿Está el modelo alineado con nuestras prioridades de negocio?


8. Are we comfortable with our level of IT risk?

8. ¿Estamos cómodos con nuestro nivel de riesgos de la T.I.?
Companies need a comprehensive system for managing IT risk that assesses the full range of risks (for example, hacking attacks, vendor failure, and technical failure) and addresses the root causes, which include redundant technology, incorrect policies, poor processes, and insufficient oversight.

Las empresas necesitan un sistema integral para la gestión de riesgo que evalúa toda la gama de riesgos informáticos (por ejemplo, ataques de piratas informáticos, la N.S.A., problemas de vendedores y técnico fracaso). Este marco debe abordar las causas fundamentales, que incluyen la tecnología redundante, políticas equivocadas, malos procesos, e insuficiente supervisión.
Question(s) to ask: How is our level of IT risk measured, and is it aligned with the company’s overall risk appetite?

Pregunta(s) a plantear: ¿Cómo se mide nuestro nivel de riesgo de la I.T.? ¿Está este riesgo informático alineado con el apetito de riesgo global de la empresa?


9. Are we making the most of our technology story?

9. ¿Estamos aprovechando bien de nuestra historia de la tecnología?
IT is already on the minds of analysts, customers, regulators, and shareholders, and interest will rise with more digitization.

La T.I. ya está en la mente de los analistas, clientes, reguladores y accionistas. Interés aumentará cuando las empresas son cada vez más digital.
Question(s) to ask: How, when, and to whom should the IT message be communicated?

Pregunta(s) a plantear: ¿Cómo, cuándo y a quién se debe comunicar el mensaje de T.I.?

No hay comentarios:

Publicar un comentario