domingo, 8 de mayo de 2016

El Papel Que Desarrolla el Business Intelligence En Las Empresas.

Business Intelligence se le denomina a la habilidad de transformar los datos en información, y a su vez, la información en conocimiento, con el fin de facilitar la toma de decisiones en los negocios.


Otra manera de definir Business Intelligence es como el conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales e información desestructurada en información estructurada.

Business Intelligence actúa proporcionando información privilegiada a las empresas sobre problemas de negocio, lo que genera una gran ventaja competitiva a su favor con respecto a las otras empresas.

Los principales productos de Business Intelligence que existen hoy en día son:

  • Cuadros de Mando Integrales (CMI). Se trata de una herramienta de control empresarial que permite establecer y monitorizar los objetivos de una empresa.  Entre los tipos de cuadros de mando se encuentran:
    • El Cuadro de Mando Operativo (CMO). Es una herramienta de control enfocada al seguimiento de variables pertenecientes a áreas o departamentos específicos de una empresa.
    • El Cuadro de Mando Integral  (CMI). representa la ejecución estratégica desde la Dirección General. Los objetivos estratégicos se organizan en cuatro áreas o perspectivas.
      • La perspectiva financiera.
      • La perspectiva del cliente.
      • La perspectiva interna.
      • La perspectiva de aprendizaje y crecimiento.
  • Sistema de soporte a la decisión (DSS). Se trata de una herramienta de Business Intelligence enfocada al analisis de los datos de una organización. El DSS destaca debido a que, entre otras propiedades, permite resolver gran parte de las limitaciones de los programa de gestión. Estas son algunas de sus características principales:
    • Informes dinámicos, flexibles e interactivos.
    • No requiere conocimientos técnicos.
    • Rapidez en los tiempos de respuesta.
    • Integración entre todos los sistemas de la compañía.
    • Cada usuario dispone de información adecuada a su perfil.
    • Disponibilidad de información histórica.



  • Sistema de información ejecutiva (EIS). Se encarga de proveer a los gerentes de un acceso sencillo a información interna y externa de su compañía, y que es relevante para sus factores clave de éxito. El objetivo principal de este sistema es proporcionar acceso a los indicadores de negocio que le afectan al instante. Es decir, los hace EIS es mostrar informes y listados de las diferentes áreas de negocio. Además, se caracteriza por ofrecer a ejecutivo un acceso rápido y efectivo a la información compartida.


Por otro lado, podemos encontrar también:


  • Datamart. es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Un datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de información.
  • Datawarehouse. Se encarga de integrar y depurar información de una o más fuentes distintas, con el fin de luego procesarla, permitiendo así el análisis desde infinidad de perspeciva y con tiempos de respuesta muy cortos.



Bibliografía:

http://www.sinnexus.com/business_intelligence/
http://www.sinnexus.com/business_intelligence/cuadro_mando_integral.aspx
http://www.sinnexus.com/business_intelligence/sistemas_informacion_ejecutiva.aspx
http://www.sinnexus.com/business_intelligence/sistemas_soporte_decisiones.aspx
http://www.sinnexus.com/business_intelligence/datamart.aspx
http://www.sinnexus.com/business_intelligence/datawarehouse.aspx

domingo, 17 de abril de 2016

Recuperación de la Información




El tema sobre el que vamos a hablar está muy relacionado con el tema anterior, es por eso que no lo explicare desde cero, sino que continuare a partir de lo dicho anteriormente. Esta relación se debe a que cuando buscamos algo en Google, el buscador se dispone a realizar una recuperación de datos, que es el resultado de nuestra búsqueda. Esta recuperación de datos se realiza dentro de la base de datos del buscador con el objetivo de recuperar textos, imágenes, etc.

Para acceder a esta base de datos, se utilizan:

  • Buscadores: con el fin de recuperar información almacenada en internet.
  • Directorios: son listas que están ordenadas y permiten acceder a la información de manera clara.
  • Metabuscadores: estos buscan la información en diferentes bases de datos.
  • Buscadores selectivos: buscan información en una base de datos que solo contiene información de un área especifica.

Para facilitar la búsqueda de información, es recomendable introducir las palabras claves. Estas palabras clave sirven para encontrar de manera sencilla la información, pero para que esto ocurra, las páginas web deben estar bien etiquetadas.

Para recuperar la información, nos podemos encontrar con dos enfoques diferentes:

  • El procesamiento estadístico: en este procesamiento, se asigna un peso a cada término en función de su relevancia con el resto del texto, sin importar el orden ni la estructura
  • El procesamiento lingüístico: los documentos son analizados en diferentes niveles lingüístico que se han establecido anteriormente.

También, para recuperar la información, se usan muchos tipos de ecuaciones como el truncamiento, los operadores booleanos... o incluso programas como Webspirs.


Para finalizar, quiero añadir que el resto de información necesaria para completar el tema, se encuentra el la entrada anterior del Blog, es decir, El buscador de Google.






domingo, 3 de abril de 2016

El Sistema de Búsqueda de Google

Cuando entras en internet y te dispones a hacer una búsqueda en Google, en un instante obtienes los resultados, los cuales coinciden en gran parte con lo que buscas. Dichos resultados se obtienen a través de tres procesos principales:
  • El Rastreo: es la técnica que utiliza Google para encontrar nueva páginas. Para realizar esta tarea se utilizan miles de equipos informáticos los cuales están las 24 horas en funcionamiento. El programa que se encarga de esto se le conoce como Robot o Araña, el cual utiliza un proceso de rastreo algorítmico. Este proceso se realiza a través de otros programas informáticos que determinan los sitios que hay que rastrear, con que frecuencia hay que rastrearlos y el número de páginas que hay que explorar en cada uno de ellos. Es decir, cada vez que Google registra una página a través del rastreo, los enlaces que se encuentran en dicha página son añadidos a la lista de rastreo.

  • Indexación: se procesan todas las páginas que son rastreadas para compilar un índice masivo de todas las palabras que ve junto con su ubicación en cada página. En este proceso, el robot puede procesar muchos datos de cada página, pero no todos. Cada búsqueda que realizamos sobre cualquier tema, hace que la indexación de Google crezca. 



  • Publicación de resultados: cuando realizamos una búsqueda en Google, este nos muestra los resultados que considera más relevantes para el usuario. Uno de los factores que determina el nivel de relevancia es la clasificación PageRank. Esto lo hace a través de la asignación de Google hacia una página en función de los enlaces que procedan de otras páginas. Las mejores páginas para Google son las que tienen mayor calidad de contenido.

Por otro lado, encontramos la lucha contra el spam: Una parte del spam se elimina automáticamente y otra parte susceptible a ser spam, se elimina de forma manual. Para esta última se avisa a los propietarios para que tengan la oportunidad de corregirlo.




Referencias:
https://support.google.com/webmasters/answer/70897?hl=es
https://www.nbweb.es/blog/como-funciona-el-buscador-google/


domingo, 13 de marzo de 2016

Los Sistemas de Almacenamiento Actuales y Tendencias del Futuro.

Los sistemas de almacenamiento evolucionan a gran velocidad a lo largo de los años, no solo en los dispositivos o medios donde se almacenan, sino también en capacidad. A continuación, hablare de los sistemas de almacenamiento actuales.

Uno de los dispositivos de almacenamiento más usados es la memoria de almacenamiento aleatorio, más conocido como Memoria RAM. En esta memoria no se pueden guardar datos  como peliculas, musica o un pdf, ya que en esta memoria se cargan todas las instrucciones que ejecuta el procesador.

Otro de los dispositivos de almacenamiento que cada año es menos utilizado son los CD´s y DVD´s. La diferencia entre estos es que el DVD es mejor que el CD ya que tiene una mayor capacidad de almacenamiento de datos, emplea un laser de lectura con una longitud de onda menor que el CD, lo que le hace más rápido, etc.
Estos dispositivos también han evolucionado hasta el denominado Blu-ray Disc que se utiliza para almacenar películas de gran calidad gráfica.


La memoria USB es un bus estándar industrial que define los cables, conectores y protocolos usados en un bus para conectar, comunicar y proveer de alimentación eléctrica entre computadoras, periféricos y dispositivos electrónicos. La primera especificación completa 1.0 se publicó en 1996, pero en 1998 con la especificación 1.1 comenzó a usarse de forma masiva.



También encontramos los discos duros, donde principalmente encontramos el clásico HDD, el que tiene cualquier en su ordenador para guardar toda la información. Dicha información la guarda mediante un sistema de grabación magnética, Se compone de disco unidos por un eje. El problema de estos discos duros es que su velocidad no es la más alta del mercado, ya que en velocidad, los SSD son los lideres del mercado. Un SSD utilizan memoria no volátil, como la memoria flash, en lugar de discos magnéticos.



En cuanto a la base de datos (cuya abreviatura es BD) es una entidad en la cual se pueden almacenar datos de manera estructurada, con la menor redundancia posible. Diferentes programas y diferentes usuarios deben poder utilizar estos datos.

El Big Data o Datos masivos es un concepto que hace referencia al almacenamiento de grandes cantidades de datos y a los procedimientos usados para encontrar patrones repetitivos dentro de esos datos. El fenómeno del Big Data también es llamado datos a gran escala. El límite superior de procesamiento ha ido creciendo a lo largo de los años. De esta forma, los límites fijados en 2008 rondaban el orden de petabytes a zettabytes de datos. Existen muchísimas herramientas para tratar con Big Data, las cuales tratan con los tipos de Big Data:

  • Datos estructurados: son datos que tienen definidos su longitud y formato
  • Datos no estructurados: son aquellos datos que vienen en el formato tal y como fueron recolectados, por lo que carecen de un formato específico.

Dentro de las Bases de datos, hay que destacar el  metadato, que no es más que un dato estructurado sobre la información, o sea, información sobre información, o de forma más simple, datos sobre datos.

La manera de leer esta base de datos es a través del lenguaje SQL. Una de sus características es el manejo del álgebra y el cálculo relacional que permiten efectuar consultas con el fin de recuperar, de forma sencilla, información de bases de datos, así como hacer cambios en ellas.






Referencias:
Videoconferencias del profesor
Apuntes de la asignatura
https://es.wikipedia.org/wiki/Memoria_de_acceso_aleatorio
https://es.wikipedia.org/wiki/DVD
http://es.ccm.net/contents/66-introduccion-bases-de-datos
https://es.wikipedia.org/wiki/Big_data

domingo, 28 de febrero de 2016

Los Lenguajes de Programación actuales.

Antes de hablar de los lenguajes de programación actuales, hablaremos un poco sobre historia. Ada Lovelace es considerada la primera programadora de la historia. El lenguaje de programación Ada recibió ese  nombre en honor a ella.
El primer lenguaje de programación de alto nivel fue el FORTRAN. A partir de este lenguaje, se crearon lenguajes de programación muy conocidos en la actualidad, como son el Pascal en 1968 y C en 1972.

Hay diferentes tipos de lenguajes desde los orígenes entre los que se encuentran:

Lenguaje máquina: es la codificación de unos y ceros de instrucciones de datos.

Lenguaje ensamblador: es una variante de un lenguaje máquina en el cual se manejan identificadores en lugar de los códigos reales para las operaciones, los valores y las localidades de almacenamiento de la máquina.

Lenguaje de bajo nivel: es el conjunto del lenguaje máquina y lenguaje ensamblador.

Lenguaje de alto nivel: este lenguaje se utiliza para comunicarse con el sistema utilizando un lenguaje cómodo y más natural. Tambien se conoce como lenguaje de programación.

Entre los lenguajes de programación más utilizados y conocidos se encuentran: SQL, Java, Python, Pascal, C, C#, C++, HTML, Pascal, Objective C, etc. 
Los cinco lenguajes que he elegido para hablar de ellos son:
Java, C++, Python, HTML y Objective C. A medida que los vaya explicando, daré la razón por la cual he elegido dicho lenguaje.

  • Java: la razón por la que he elegido ese lenguaje, es porque es, diría yo, el mejor lenguaje de programación orientado a objetos. Pero, ¿por que es el mejor? Las respuestas a esto son las siguientes:
    • No es necesario reescribir el código en otros computadores, siempre y cuando dicho computador sea compatible con Java.
    • El JDK es una herramienta libre de licencias, es decir, gratis.
    • Existen dentro de su librería clases gráficas como awt y swing, las cuales permiten crear objetos gráficos comunes altamente configurables y con una arquitectura independiente de la plataforma. 
    • Es un lenguaje menos complejo que la mayoría.

  • C++: es un lenguaje de programación diseñado a mediados de los años 1980 por Bjarne Stroustrup. La intención de su creación fue el extender al lenguaje de programación C mecanismos que permiten la manipulación de objetos. En ese sentido, desde el punto de vista de los lenguajes orientados a objetos, el C++ es un lenguaje híbrido. La expresión de C++, significa una extensión de C. La razón por la que lo he elegido, es porque es de los más utilizados actualmente además de que es muy didáctico, ya que a partir de este se pueden aprender muchos otros lenguajes de manera fácil. Otra de sus características es que existen muchos algoritmos cuyo pseudocódigo se encuentra ya desarrollado en C++, de manera que puedes tomarlo y amoldarlo a tu solución.

  • Python: es uno de los lenguajes más sencillos de manejar que existen, además de que tiene innumerables salidas a la hora de trabajar en él. Además es un lenguaje muy elegantes y flexible. Además, es la propia comunidad la que se encarga de mejorarlo y hacer actualizaciones. Eso si, aunque sea más sencillo que otros, no se considera que sea más eficaz que otros lenguajes como los anteriormente nombrados. Su primera aparición fue en 1991, y fue diseñado por Guido van Rossum. Por último, decir que es un software libre y multiplataforma.

  • HTML: sigla en inglés de HyperText Markup Language, es un estándar que sirve de referencia del software que conecta con la elaboración de páginas web en sus diferentes versiones, define una estructura básica y un código (denominado código HTML) para la definición de contenido de una página web, como texto, imágenes, videos, juegos, entre otros. La razón por la que he escogido este lenguaje es porque es el más utilizado en cuanto a programación web.




  • Objective C: Para ser un lenguaje de programación creado en 1980, Objetive C sigue estando en plena forma. Tanta que forma parte del core sobre el que se desarrollan los lenguajes de programación que emplea Apple en sus sistemas operativos, siendo el auténtico corazón de iOS., y es por esto por lo que he elegido este lenguaje. Se trata de un lenguaje de programación orientado a objetos creado como un superconjunto de C para que implementase un modelo de objetos parecido al de Smalltalk.




Documentación de apoyo:
Video conferencias del profesor.
Libro Sistemas Operativos de Sebastián Sánchez Prieto (Tema 1: Introducción).
http://www.muypymes.com/2013/04/17/lenguajes-de-programacion-demandados-empresas
http://meetingjava.blogspot.com.es/2006/08/ventajas-y-desventajas-del-java.html
http://www.maestrosdelweb.com/ventajas-python/
https://es.wikipedia.org/wiki/HTML

viernes, 12 de febrero de 2016

Actividad 1: La Información

Para poder hablar de la información, debemos saber que es la información. La información es un conjunto de datos que sabemos en nuestra cabeza y que a través de dicha información adquirimos conocimientos. Es decir, podemos tener información y datos sin tener conocimiento pero no al revés.

La información la podemos adquirir de varias maneras, ya sea de forma oral, es decir, a través del habla. También la adquirimos de manera escrita, visual, etc.

Hoy en día, hay tantos medios de adquirir información y tanta información por aprender, que si dedicásemos 24 horas al día durante toda nuestra vida a aprender acerca de un campo específico, apenas podríamos llegar a conocer un 3% de dicho campo. El hecho de que haya tantos medios de adquirir información no quiere decir que se gane un mayor conocimiento.

En cuanto a las ciencias de la documentación, encontramos la informática, mas específicamente la inteligencia artificial, la cual hoy en día esta presente en muchas maquinas y sistemas como por ejemplo en los sistemas de los coches actuales los cuales se activan ante una curva o peligro, o simplemente el buscador de Google.

Por otro lado también encontramos la teledocumentación, que es el acceso a la información a través de internet. La teledocumentación es un conjunto de telecomunicacion, información y documentación.

En cuanto a la bibliometría, se trata de la aplicación de las matemáticas y métodos estadísticos y otros medios de comunicación para informar sobre los procesos de la comunicación escrita. Es decir, en función de las visitas y referencias que tenga cierta información, se estimará si dicha información de buena calidad o no.

La bibliografía es aquella parte de un documento donde se cita el origen del contenido de la información de dicho documento. No es lo mismo bibliografía que referencia. Cuando hablamos de referencia, hablamos de una aclaración que hacemos en cierta frase para explicar por que escribimos dicha frase.

La biblioteconomía se encarga de analizar la documentación, sus destinos, su recuperación,etc.


En cuanto a la tipología de documentos, el soporte físico en el que se encuentra un documento puede ser:
- Textuales e impresos: soporte papel
- Micrográficos: microfilm
- Audiovisuales: vídeo, películas
- Magnéticos: discos magnéticos, cinta magnética
- Ópticos: CD-ROM - electrónicos: bases de datos “on-line”


Para que la documentación cumpla sus objetivos, se sigue en mayor o menor profundidad la llamada cadena documental. Bibliotecas:

Selección: es la recogida de documentos que merece ser seleccionado y transmitidos al usuario.
Análisis: consiste en representar el documento de una manera diferente a la original.
Búsqueda: procedimientos para obtener información concreta en una búsqueda concreta.
Difusión: consiste en difundir la información mediante una serie de servicios específicos.


En cuanto a las fuentes de la información, distinguimos entre:

-Literatura Gris: es aquella información que se distribuye por canales convencionales, y que por tanto son dificiles de obtener.

-Bibliotecas Depositarias: son bibliotecas científicas donde se conservan documentos con el fin de difundirdichos documentos científicos originales a todo el mundo.