Jordy Perez: Sistemas de almacenamiento y evolución de la informática

LOS DISPOSITIVOS DE ALMACENAMIENTO

1..- ¿Qué es una unidad de almacenamiento?

Las unidades de almacenamiento son dispositivos periféricos del sistema, que actúan como medio de soporte para la grabación de los programas de usuario, y de los datos y ficheros que son manejados por las aplicaciones que se ejecutan en estos sistemas.

Las unidades de almacenamiento masivo de información objeto de esta guía se utilizan en todos los entornos informáticos existentes: entornos centralizados de mainframes, entornos distribuidos cliente-servidor, entornos monopuesto de sobremesa, entornos monopuesto portátiles, etc.

Por ejemplo:

La memoria de la computadora (RAM) es un lugar provisional de almacenamiento para los archivos que usted usa. La mayoría de la información guardada en la RAM se borra cuando se apaga la computadora. Por lo tanto, su computadora necesita formas permanentes de almacenamiento para guardar y recuperar programas de software y archivos de datos que desee usar a diario. Los dispositivos de almacenamiento (también denominados unidades) fueron desarrollados para satisfacer esta necesidad.

Los siguientes constituyen los tipos más comunes de dispositivos de almacenamiento:

Unidades de Disco Duro.
Unidades de Disquete.
Unidades de compresión ZIP.
Unidades de CD.
Unidades DVD.
Unidad para Cinta.

Dispositivos de Almacenamiento de un Ordenador

COMO IDENTIFICAR LAS DE ALMACENAMIENTO?

La unidad de disco duro (1) se encuentra adentro de la computadora y no es necesario obtener acceso a la misma. Puede obtener acceso a la unidad de CD (2) y la unidad de disquetes desde el panel frontal de la computadora. La unidad de CD consiste en un dispositivo de 5,25 pulgadas con una ranura cubierta o con una bandeja deslizable, un botón de carga/expulsión y un indicador de actividad luminoso. La unidad de disquetes (3) consiste en un dispositivo de 3,5 pulgadas con una ranura cubierta, un botón de expulsión y un indicador de actividad luminoso. Para ver la ubicación de estas unidades, seleccione la computadora de la lista que se encuentra al fondo de esta página.

CLASIFICACION DE LAS UNIDADES EN UNA COMPUTADORA.

Usted debe saber la clasificacion (la letra) de la unidad para que puede indicarle a la computadora dónde guardar los archivos o dónde recuperar los archivos que necesita. Las unidades se designan por letra del alfabeto. La unidad de disco duro(3) es designa comúnmente con la letra C, la unidad de disquetes(2) con la A y la unidad de CD(3) con la D.

Para averiguar la designación de una unidad instalada en la computadora, haga doble clic en el icono Sistema en elPanel de Control. Haga clic en la lengüeta Administrador de Dispositivos y haga doble clic en el dispositivo de su elección. Bajo la lengüeta Configuraciones, usted verá la asignación actual de letras de unidades.

Unidad de Disco Duro

Unidad de CD

Unidad de Disquetes

La unidad de disco duro se designa como unidad C, la unidad de CD como unidad D y la unidad de disquete como unidad A. Sin

embargo, si la unidad de disco duro está particionada, se designa como C y D, y la unidad de CD queda como unidad E.

EL DISCO DURO

El disco duro es el sistema de almacenamiento más importante de su computador y en el se guardan los archivos de los programas - como los sistemas operativo D.O.S. o Windows 95, las hojas de cálculo (Excel, Qpro, Lotus) los procesadores de texto (Word, WordPerefct, Word Star, Word Pro), los juegos (Doom, Wolf, Mortal Kombat) - y los archivos de cartas y otros documentos que usted produce.

La mayoría de los discos duros en los computadores personales son de tecnología IDE (Integrated Drive Electronics), que viene en las tarjetas controladoras y en todas las tarjetas madres (motherboard) de los equipos nuevos. Estas últimas reconocen automáticamente (autodetect) los discos duros que se le coloquen, hasta un tamaño de 2.1gigabytes.

La tecnología IDE de los discos duros actuales ha sido mejorada y se le conoce como Enhaced IDE (EIDE), permitiendo mayor transferencia de datos en menor tiempo. Algunos fabricantes la denominan Fast ATA-2. Estos discos duros son más rápidos y su capacidad de almacenamiento supera un gigabyte. Un megabyte (MB) corresponde aproximadamente a un millón de caracteres y un gigabyte (GB) tiene alrededor de mil megabytes. Los nuevos equipos traen como norma discos duros de 1.2 gigabytes.

Las motherboards anteriores con procesadores 386, y las primeras de los 486, reconocen solo dos discos duros, con capacidad hasta de 528 megabytes cada uno y no tienen detección automática de los discos. Para que estasmotherboards reconozcan discos duros de mayor capacidad, debe usarse un programa (disk manager) que las engaña, haciéndoles creer que son de 528 megabytes.

Si su computador es nuevo, la motherboard le permite colocar hasta cuatro unidades de disco duro. El primer disco duro se conoce como primario master, el segundo como primario esclavo, el tercero como secundario master y el cuarto como secundario esclavo. El primario master será siempre el de arranque del computador (C :\>).

La diferencia entre master y esclavo se hace mediante un pequeño puente metálico (jumper) que se coloca en unos conectores de dos paticas que tiene cada disco duro. En la cara superior del disco aparece una tabla con el dibujo de cómo hacer el puente de master, esclavo o master con esclavo presente.

LA ESTRTUCTURA DEL DISCO DURO

La estructura física de un disco es la siguiente: un disco duro se organiza en platos (PLATTERS), y en la superficie de cada una de sus dos caras existen pistas (TRACKS) concéntricas, como surcos de un disco de vinilo, y las pistas se dividen en sectores (SECTORS). El disco duro tiene una cabeza (HEAD) en cada lado de cada plato, y esta cabeza es movida por un motor servo cuando busca los datos almacenados en una pista y un sector concreto.

El concepto "cilindro" (CYLINDER) es un parámetro de organización: el cilindro está formado por las pistas concéntricas de cada cara de cada plato que están situadas unas justo encima de las otras, de modo que la cabeza no tiene que moverse para acceder a las diferentes pistas de un mismo cilindro.

En cuanto a organización lógica, cuando damos formato lógico (el físico, o a bajo nivel, viene hecho de fábrica y no es recomendable hacerlo de nuevo, excepto en casos excepcionales, pues podría dejar inutilizado el disco) lo que hacemos es agrupar los sectores en unidades de asignación (CLUSTERS) que es donde se almacenan los datos de manera organizada. Cada unidad de asignación sólo puede ser ocupado por un archivo (nunca dos diferentes), pero un archivo puede ocupar más de una unidad de asignación.

COMO FUNCIONA EL DISCO DURO

Cuando usted o el software indica al sistema operativo a que deba leer o escribir a un archivo, el sistema operativo solicita que el controlador del disco duro traslade los cabezales de lectura/escritura a la tabla de asignación de archivos (FAT). El sistema operativo lee la FAT para determinar en qué punto comienza un archivo en el disco, o qué partes del disco están disponibles para guardar un nuevo archivo.

Los cabezales escriben datos en los platos al alinear partículas magnéticas sobre las superficies de éstos. Los cabezales leen datos al detectar las polaridades de las partículas que ya se han alineado.

Es posible guardar un solo archivo en racimos diferentes sobre varios platos, comenzando con el primer racimo disponible que se encuentra. Después de que el sistema operativo escribe un nuevo archivo en el disco, se graba una lista de todos los racimos del archivo en la FAT.

Un ordenador funciona al ritmo marcado por su componente más lento, y por eso un disco duro lento puede hacer que tu MAQUINA sea vencida en prestaciones por otro equipo menos equipado en cuanto a procesador y cantidad de memoria, pues de la velocidad del disco duro depende el tiempo necesario para cargar tus programas y para recuperar y almacenar tus datos.

CARACTERISTICAS DEL DISCO DURO

A continuación vamos a indicar los factores o características básicas que se deben tener en cuenta a la hora de comprar un disco duro.

Capacidad de almacenamiento

La capacidad de almacenamiento hace referencia a la cantidad de información que puede grabarse o almacenar en un disco duro. Hasta hace poco se medía en Megabytes (Mg), actualmente se mide en Gigabytes (Gb).

Comprar un disco duro con menos de 3,5 GIGAS de capacidad dará lugar a que pronto te veas corto de espacio, pues entre el sistema operativo y una suite ofimática básica (procesador de texto, base de datos, hoja de cálculo y programa de presentaciones) se consumen en torno a 400 MB.

Si instalas los navegadores de MICROSOFT y NETSCAPE suma otros 100MB; una buena suite de tratamiento gráfico ocupa en torno a 300MB y hoy en día muchos juegos ocupan más de 200MB en el disco duro.

Ya tenemos en torno a 1,5 GIGAS ocupados y aún no hemos empezado a trabajar con nuestro ordenador.

Si nos conectamos a Internet, vermos que nuestro disco duro empieza a tener cada vez menos espacio libre, debido a esas páginas tan interesantes que vamos guardando, esas imágenes que resultarán muy útiles cuando diseñemos nuestra primera Página WEB y esas utilidades y programas SHAREWARE que hacen nuestro trabajo más fácil.

Velocidad de Rotación (RPM)

Es la velocidad a la que gira el disco duro, más exactamente, la velocidad a la que giran el/los platos del disco, que es donde se almacenan magnéticamente los datos. La regla es: a mayor velocidad de rotación, más alta será la transferencia de datos, pero también mayor será el ruido y mayor será el calor generado por el disco duro. Se mide en número revoluciones por minuto ( RPM). No debe comprarse un disco duro IDE de menos de 5400RPM (ya hay discos IDE de 7200RPM), a menos que te lo den a un muy buen precio, ni un disco SCSI de menos de 7200RPM (los hay de 10.000RPM). Una velocidad de 5400RPM permitirá una transferencia entre 10MB y 16MB por segundo con los datos que están en la parte exterior del cilindro o plato, algo menos en el interior.

Tiempo de Acceso (Access Time)

Es el tiempo medio necesario que tarda la cabeza del disco en acceder a los datos que necesitamos. Realmente es la suma de varias velocidades:

* El tiempo que tarda el disco en cambiar de una cabeza a otra cuando busca datos.
* El tiempo que tarda la cabeza lectora en buscar la pista con los datos saltando de una a otra.
* El tiempo que tarda la cabeza en buscar el sector correcto dentro de la pista.

Es uno de los factores más importantes a la hora de escoger un disco duro. Cuando se oye hacer ligeros clicks al disco duro, es que está buscando los datos que le hemos pedido. Hoy en día en un disco moderno, lo normal son 10 milisegundos.

Memoria CACHE (Tamaño del BUFFER)

El BUFFER o CACHE es una memoria que va incluida en la controladora interna del disco duro, de modo que todos los datos que se leen y escriben a disco duro se almacenan primeramente en el buffer. La regla de mano aquí es 128kb-Menos de 1 Gb, 256kb-1Gb, 512kb-2Gb o mayores. Generalmente los discos traen 128Kb o 256Kb de cache.

Si un disco duro está bien organizado (si no, utilizar una utilidad desfragmentadora: DEFRAG, NORTON SPEEDISK, etc.), la serie de datos que se va a necesitar a continuación de una lectura estará situada en una posición físicamente contigua a la última lectura, por eso los discos duros almacenas en la caché los datos contiguos, para proporcionar un acceso más rápido sin tener que buscarlos. De ahí la conveniencia de desfragmentar el disco duro con cierta frecuencia.

El buffer es muy útil cuando se está grabando de un disco duro a un CD-ROM, pero en general, cuanto más grande mejor, pues contribuye de modo importante a la velocidad de búsqueda de datos.

Tasa de transferencia (Transfer Rate)

Este número indica la cantidad de datos un disco puede leer o escribir en la parte más exterrior del disco o plato en un periodo de un segundo. Normalmente se mide en Mbits/segundo, y hoy en día, en un disco de 5400RPM, un valor habitual es 100Mbits/s, que equivale a 10MB/s.

Interfaz (Interface) - IDE - SCSI

Es el método utilizado por el disco duro para conectarse al equipo, y puede ser de dos tipos: IDE o SCSI.

Todas las placas bases relativamente recientes, incluso desde las placas 486, integran una controladora de disco duro para interfaz IDE (normalmente con bus PCI) que soporta dos canales IDE, con capacidad para dos discos cada una, lo que hace un total de hasta cuatro unidades IDE (disco duro, CD-ROM, unidad de backup, etc.)

Debemos recordar, sin embargo, que si colocamos en un mismo canal dos dispositivos IDE (e.g. disco duro+CD-Rom), para transferir datos uno tiene que esperar a que el otro haya terminado de enviar o recibir datos, y debido a la comparativa lentitud del CD-ROM con respecto a un disco duro, esto ralentiza mucho los procesos, por lo que es muy aconsejable colocar el CD-ROM en un canal diferente al de el/los discos duros.

La velocidad de un disco duro con interfaz IDE tambien se mide por el PIO (modo programado de entrada y salidad de datos), de modo que un disco duro con PIO-0 transfiere hasta 3,3MB/s, PIO-1 hasta 5,2MB/s, PIO-2 hasta 8,3MB/s. Estos modos anteriores pertenecen a la especificación ATA, pero en la especificación ATA-2 o EIDE, los discos duros pueden alcanzar PIO-3, hasta 11,1MB/s, o PIO-4, hasta 16,6MB/s. Los discos duros modernos soportan en su mayoría PIO-4.

Recientemente se ha implementado la especificación ULTRA-ATA o ULTRA DMA/33, que puede llegar a picos de transferencia de hasta 33,3MB/s. Este es el tipo de disco duro que hay que comprar, aunque nuestra controladora IDE no soporte este modo (sólo las placas base Pentium con chipset 430TX y las nuevas placas con chipsets de VIA y ALI, y la placas Pentium II con chipset 440LX y 440BX lo soportan), pues estos discos duros son totalmente compatibles con los modos anteriores, aunque no les sacaremos todo el provecho hasta que actualicemos nuestro equipo.

En cuanto al interfaz SCSI, una controladora de este tipo suele tener que comprarse aparte (aunque algunas placas de altas prestaciones integran este interfaz) y a pesar de su precio presenta muchas ventajas.

Se pueden conectar a una controladora SCSI hasta 7 dispositivos (o 15 si es WIDE SCSI)de tipo SCSI (ninguno IDE), pero no solo discos duros, CD-ROMS y unidades de BACKUP, sino también grabadoras de CD-ROM (las hay también con interfaz IDE), escáneres, muchas de las unidades de BACKUP, etc.

Otra ventaja muy importante es que la controladora SCSI puede acceder a varios dispositivos simultáneamente, sin esperar a que cada uno acabe su transferencia, como en el caso del interfaz IDE, aumentando en general la velocidad de todos los procesos.

Las tasas de transferencia del interfaz SCSI vienen determinados por su tipo (SCSI-1, Fast SCSI o SCSI-2, ULTRA SCSI, ULTRA WIDE SCSI), oscilando entre 5MB/s hasta 80MB/s. Si el equipo va a funcionar como servidor, como servidor de base de datos o como estación gráfica, por cuestiones de velocidad, el interfaz SCSI es el más recomendable.

* GLOSARIO BASICO .

Bit

La unidad más pequeña de información; también el espacio de disco que se usa para guardar esta información.

Byte (Unidad de información)

Ocho bits de información; 1024 bytes son iguales a un kilobyte (KB), 1024 kilobytes son iguales a un megabyte (MB),1024 megabytes son iguales a un gigabyte (GB).

Cabezales de Lectura/Escritura

La parte de una unidad de disco que realmente lee y escribe la información en el disco.

De Sola Lectura/Protección Contra Escritura

Información guardada que se puede ver y usar pero que no se puede cambiar.

Disco

Una unidad con un plato o más que se usan para guardar información.

Hacer Copia de Seguridad

Una copia doble almacenada de la información de disco.

Memoria intermedia

Un área de almacenamiento de la memoria que guarda información que se traslada de un lugar a otro hasta que el dispositivo receptor esté listo para aceptarla.

Particionado

División de una unidad de disco duro de gran capacidad (por ejemplo, de 6,5 gigabytes) en dos o más unidades virtuales.

Pista

Una vía de acceso singular y circular en un lado de un disco o una cinta.

Tabla de Asignación de Archivos (FAT)

Área de un disco que se mantiene al tanto de cuáles racimos del disco están ocupados y cuáles están disponibles.

3.- Conceptos y funcionalidades básicas de las unidades de almacenamiento.

En este apartado se describen los conceptos técnicos relacionados con los dispositivos de almacenamiento masivo de información y se relacionan las principales características definitorias y diferenciadoras de los dispositivos de almacenamiento de información más extendidos.

Los conceptos generales aplicables a unidades de almacenamiento son:

Composición de los medios de grabación magnética

Los medios de grabación magnética consisten en un soporte que bien puede ser rígido (discos duros) o blando (discos flexibles o disquetes, cintas, etc.), sobre el que se deposita una fina película magnética para su grabación. Esta película está compuesta de diferentes materiales magnéticos: óxido de hierro, de cromo, de hierro-cobalto, de cobalto-níquel, etc.

Para el almacenamiento de los datos se crean dominios magnéticos de polarización inversa a la dirección preferente de polarización que tiene la película magnética. Cada dominio magnético se corresponde a un punto de memoria o bit. Para aumentar la densidad de grabación, esta dirección preferente de polarización debe ser perpendicular a la película magnética.

Las características de estos dispositivos vienen determinadas por las propiedades de la capa magnetizable y del soporte, las cuales determinan la densidad de grabación y la relación señal/ruido de lectura.

Modos de grabación y lectura magnéticos

Los transductores de lectura y escritura para grabación magnética se componen de una cabeza de estructura toroidal, con un arrollamiento por el que circulan las "corrientes eléctricas de lectura y/o escritura" dependiendo de que exista un único transductor o dos, uno para lectura y otro para escritura. El núcleo de la cabeza se construye de ferrita o laminado de hierro.

En la operación de escritura se hace pasar una pequeña corriente por la cabeza, la cual produce un campo magnético que magnetiza la película de material magnético que se mueva en su proximidad. Invirtiendo el sentido de la corriente se invierte el sentido del campo y, por tanto, el sentido de magnetización del soporte.

En la operación de lectura, se hace pasar un soporte grabado magnéticamente cuyos cambios de magnetización, en los bordes de los dominios, producen unos cambios magnéticos en la cabeza que, a su vez, inducen corrientes en el arrollamiento, proporcionales a la densidad de flujo magnético.

Los códigos de grabación más comunes son los que relacionan a continuación:

Código RZ

La grabación de medios magnéticos, utilizando códigos RZ (Return to Zero, Retorno a Cero), consiste en grabar dominios de magnetización inversa, mediante impulsos de corriente en sentidos contrarios. De este modo se obtienen dos impulsos por cada bit grabado o detectado: un impulso negativo seguido de uno positivo si se detecta un cero, o un impulso positivo seguido de uno negativo si se detecta un uno. El tamaño de los dominios viene determinado por el ancho de los impulsos y por la velocidad con la que se desplace el medio de grabación.

Las ventajas de este código son que tiene grabado el reloj de lectura y permite diferenciar entre el "1" y el "0". Su inconveniente es que se desperdicia mucho espacio, pues las zonas desmagnetizadas que existen entre cada dos dominios no guardan información, con lo que la densidad de almacenamiento que es posible alcanzar es muy baja.

Código NRZ

El código NRZ (Non Return to Zero) es similar al RZ pero se han eliminado las zonas desmagnetizadas. Sólo se obtienen impulsos para los cambios de "1" a "0" y de "0" a "1".

Este código necesita sincronización externa. La pérdida de sincronización no se detecta y produce información errónea. En el caso de producirse un error, quedan afectados todos los bits posteriores. Su ventaja es que permite una gran densidad de grabación.

Código NRZI

En el código NRZI (Non Return to Zero Inverted), variante del código NRZ, se representan únicamente los "1" por cambio en la polaridad del medio magnético, que se traduce en un impulso durante la operación de lectura. La inexistencia de señal se interpreta como un "0".

Este código necesita sincronización externa y como sucede con el código NRZ, no se detecta la pérdida de sincronización pero en este caso el error ya no se propaga. Si se utiliza un bit de paridad se asegura que siempre exista un "1", con lo que ya queda garantizado la generación del reloj.

La ventaja de este código es que permite una gran densidad de grabación. Es muy utilizado en la grabación de las cintas magnéticas, en donde el reloj y la sincronización se graban en una pista auxiliar, que sirve además de bit de paridad para la corrección de errores.

Código FM

Este código es una modificación del código NRZ, donde se ha introducido un impulso auxiliar de reloj por bit, pero que ha de sincronizarse. Su ventaja es que permite utilizar una sola pista, pero la falta de un impulso de reloj conlleva la pérdida de sincronismo.

En el código FM (Frecuency Modulation) la falta de señal continúa interpretándose como un "0".

Con este código sólo es necesario utilizar una sola pista, pero su densidad de grabación es la mitad que en el código NRZ debido al espacio que ocupan los impulsos de reloj. Este código es muy utilizado en los disquetes de simple densidad y en muchas unidades de disco.

Código PE

En el código PE (Phase Encoding) un "0" es representado por un impulso negativo, mientras un "1" se representa por un impulso positivo. Así, el reloj está autocontenido pues cada bit representa un impulso. Es necesario eliminar los impulsos auxiliares pero la sincronización es muy fácil.

Con este código, teóricamente, se obtendría una densidad de grabación mitad que con el código NRZI, pero su propiedad de reloj autocontenido permite que en la práctica se comprima más la información. Este código es muy utilizado en las cintas magnéticas de mayor densidad de grabación.

Código RB

El código RB (Return to Bias) es una evolución del código RZ con la variación de que las zonas desmagnetizadas se polarizan negativamente. Así, un "1" se representa como en el código RZ, mientras que la falta de señal se interpreta como un "0", del mismo modo que sucede en el código NRZI.

Este código requiere reloj externo, pero la sincronización es automática. La densidad de grabación que se alcanza con este código es la mitad que la que es posible obtener con el NRZI.

Código MFM

El código MFM (Modified Frecuency Modulation) se deriva del código FM, en donde se han eliminado los impulsos de reloj innecesarios.

Las propiedades de este código son parecidas a las del FM, pero permite tener una densidad de grabación doble. Este código es muy utilizado en la grabación de los disquetes de doble densidad.

A continuación se incluye una tabla en donde se resumen las principales características de todos los modos de grabación y lectura magnéticos.

Cód.	Descripción	Reloj	Densidad Grabación	Aplicación
RZ	Cada bit es codificado un dominio magnético del sentido de polari-zación que corresponda al valor de cada bit,con retorno al nivel cero (zona desmagneti-zada) por cada bit.	Autocontenido	Muy baja	Poco utilizado
NRZ	Cada bit es codificado como un dominio magné-tico del sentido de polarización que corres-ponda al valor de cadabit, pero sin retornode cero.	Externo	Alta	Poco utilizado
NRZI	Solamente se codifican los bits igual a "1" por un cambio en elsentido de la polariza-ción del dominio corres-pondiente a ese bit.	Externo	Alta	Cintas magnéticas
FM	Idéntico al NRZ, en donde se introduce un impulso auxiliar de reloj por bit.	Autocontenido	Mitad que con el NRZ	Discos y disquetes de densidad simple
PE	Cada bit, dependiendo de que éste sea un "1" o un "0", es codificado como un cambio, en uno u otro sentido, de la dirección de polariza-ción del dominio quecorresponda a ese bit.	Autocontenido	Teóricamente la mitad que con el NRZI	Cintas magnéticas de alta densidad
RB	Idéntico al RZ, en donde las zonas desmagnetizadas se polarizan negativamente.	Externo	Mitad que con el NRZI	Poco utilizado
MFM	Idéntico al FM, en donde se eliminan los impulsos de reloj innecesarios.	Autocontenido	Doble que con el FM	Disquetes de doble densidad

Capacidad

El concepto de capacidad es, tal vez, el primero de todos los que se deberían evaluar.

Discos

La capacidad de almacenamiento de los discos se organiza en cilindros, pistas y sectores. En un sistema de varias superficies y cabeza móvil, aquellas pistas que se acceden en una misma posición de la cabeza constituyen un cilindro.

Una pista es la tira del soporte de almacenamiento que gira delante de una cabeza. En los sistemas de cabeza fija cada una de éstas define una pista, mientras en los sistemas de cabeza móvil, ésta puede adoptar una serie de posiciones y cada posición de la cabeza define una pista. Las pistas se encuentran divididas en unidades de almacenamiento menores denominadas segmentos. Un sector lo constituye el conjunto de segmentos concéntricos de cada una de las pistas.

Cada unidad de información que es transferida en un acceso constituye un sector. Estos se definen durante el proceso de dar formato al disco. En el caso de los disquetes su superficie se divide únicamente en pistas y sectores. Sólo en los sistemas de varias superficies tiene cabida la definición de cilindro.

El direccionamiento de la información deseada exige la selección de la cabeza correspondiente, para seleccionar el cilindro adecuado; el posicionamiento de la cabeza, en caso de ser móvil; y la interpretación de la información leída de la pista, para llegar a seleccionar el sector deseado.

Es importante incidir que no toda la capacidad de la unidad de almacenamiento es aprovechable. Durante el proceso de dar formato al disco se especifica la información de direccionamiento, y en algunos casos la de sincronismo, que permiten que la información que se almacene en estos dispositivos se pueda recuperar.

Debido a este proceso, siempre obligatorio, de la capacidad de almacenamiento bruta que posee el dispositivo sólo se puede destinar para el almacenamiento de datos un determinado porcentaje, que es la capacidad de almacenamiento neta o capacidad formateada.

Cintas

La capacidad de almacenamiento bruta de las cintas viene determinada por la longitud de éstas y por la densidad de grabación (número de bits que pueden ser grabados por pulgada). No obstante, tampoco puede utilizarse toda su capacidad bruta para grabar información ya que también hay que guardar la información de dirección para poder acceder a la zona de datos deseada. Además, las poleas necesitan un cierto tiempo para parar y alcanzar la velocidad de régimen de la cinta, por lo que hay que dejar unos claros o zonas muertas entre los registros independientes, los denominados IRG (Inter Register Gaps).

A la capacidad real aprovechable, igual que en los discos, se le denomina capacidad formateada. Para disminuir el número de zonas muertas entre registros (IRG), éstos se agrupan en bloques o ficheros, sin claros entre ellos, y se define un directorio en la cabecera del fichero que especifica los registros que contiene guardando la información de dirección y de sincronismo. Al final del fichero se acompaña la información para la detección de errores y de fin de registro. Este proceso definitorio se realiza durante la operación de dar formato a la cinta, de modo que la máxima capacidad formateada o capacidad neta de la cinta siempre es inferior a la capacidad bruta de la misma.

Tiempo de acceso

Otro concepto es el tiempo de acceso a los datos grabados en la unidad de almacenamiento.

Discos

El tiempo de acceso de los discos viene determinado por el tiempo que tarda en posicionarse la cabeza de lectura-escritura en la pista deseada (tiempo de búsqueda) más el tiempo que tarda la información de la pista en pasar delante de la cabeza (tiempo de latencia). Estos tiempos, siempre se expresan en valor medio, porque tanto el tiempo de búsqueda como el tiempo de latencia dependen de la posición de partida y de la posición deseada.

Con el empleo de tecnologías ópticas el tiempo de acceso es muy pequeño, dado que el rayo láser accede a cualquier zona del disco muy rápidamente, pero todavía no es posible alcanzar en estos momentos los valores de tiempos medios de acceso que se tienen con los discos magnéticos.

Cintas

En las cintas, al ser dispositivos de almacenamiento secuencial, la unidad lectora debe explorar la cinta hasta hallar una información específica. Por consiguiente, a mayor capacidad de almacenamiento, mayor longitud de la cinta y mayor tiempo de acceso medio. Este viene determinado por el tiempo que tarda en posicionarse la cabeza de lectura-escritura al inicio del registro que se quiere leer, más el tiempo que tarda la información de la cinta en pasar delante de ella.

Este modo de acceso se convierte en el principal inconveniente de las cintas. No obstante, existen sistemas que resuelven en parte esta desventaja usando la técnica QFA (Quick File Access). Este método crea un índice para el contenido de la cinta, de modo que el equipo lógico de lectura puede utilizar esta tabla para acceder directamente a la zona donde se encuentran los datos solicitados. Para ello, en primer lugar se consulta la tabla que proporciona la posición en la cinta de los datos solicitados, y en segundo lugar se avanza a dicha posición sin necesidad de recorrer todos los datos de la cinta.

Velocidad de transferencia

Es la velocidad a la que se transmiten los bits de un registro desde el soporte magnético a la cabeza lectora. Este parámetro viene determinado por la densidad de grabación del medio y por la velocidad de giro del disco o la velocidad de avance de la cinta.

Fiabilidad

La fiabilidad de las unidades de almacenamiento se mide en términos de disponibilidad. Así, el fallo de una unidad individual de almacenamiento de datos puede suponer la detención de las operaciones realizadas con ésta. La disponibilidad de estos dispositivos se mide como el tiempo medio entre fallos (MTBF, Mean Time Between Failures).

En este sentido, las unidades de almacenamiento de información redundantes que ofrecen facilidades de detección de errores de un solo bit mejoran la disponibilidad ya que almacenan información de paridad para recuperar los datos originales en el caso de que se produzca algún fallo. De este modo se mejora notablemente la disponibilidad de los datos, denominada MTDA (Mean Time Data Access), que determina el periodo de tiempo en el que el sistema puede acceder a los datos contenidos en la unidad de almacenamiento.

3.1.- Conceptos específicos de discos

Los conceptos aplicables a discos son los siguientes:

Redundancia

Las baterías de discos RAID (Redundant Array of Inexpensive Disks, Baterías Redundantes de Discos de Bajo Coste) ofrecen una alternativa a los tradicionales sistemas de almacenamiento masivo (SLED, Single Large Expensive Disk, Discos Simples de Gran Capacidad y Alto Coste) a través de siete maneras diferentes (niveles RAID) de obtener mayores prestaciones y mayor disponibilidad de los datos al utilizar baterías de discos de bajo coste.

Las ventajas de la tecnología RAID son:

Su alta disponibilidad gracias a la dedicación de parte de los recursos de una unidad de disco a la redundancia de los datos.
Sus altas prestaciones, con un mayor número de operaciones por segundo debido a su configuración de discos en batería que posibilita el proceso de peticiones simultáneas de recuperación/almacenamiento de datos.
Su bajo costo, ya que utilizan discos estándar del mercado más pequeños.

Además, la tecnología RAID utiliza una arquitectura que protege y restaura los datos. Tras la sustitución de un disco averiado, se realiza la reconstrucción de los datos a partir de la información almacenada. El nuevo disco refleja todas las transacciones realizadas anteriormente y durante el fallo. Al mantener la integridad de los datos mientras se sustituye la unidad averiada y se regeneran los mismos, la batería de discos RAID impide su pérdida. A continuación se describen los siete niveles RAID:

Nivel 0

Este nivel no incorpora redundancia de datos. No obstante, almacena y recupera los datos con más rapidez que el almacenamiento de datos en serie en un único disco, gracias al empleo de una técnica denominada distribución de datos que mejora la velocidad de trasferencia de datos del disco. La distribución de datos divide los datos en segmentos que se transfieren a distintas unidades de disco. Su inconveniente es que no resuelve el problema de la fiabilidad pues los datos no se almacenan de manera redundante.

Nivel 1

La configuración del nivel 1 de RAID, o discos espejo, incluye dos unidades de disco: una unidad de datos y una unidad de réplica. Cuando se escriben datos en una unidad, también se escriben en la otra. El disco redundante es una réplica exacta del disco de datos, por lo que se le conoce también como disco espejo. Los datos pueden leerse de cualquiera de las dos unidades, de forma que si se avería la unidad de datos, es posible acceder a la unidad de réplica, con lo que el sistema puede seguir funcionando.

Con este nivel de RAID se obtiene la misma velocidad de lectura-escritura que con una configuración normalizada de disco, por lo que constituye la mejor opción para aplicaciones que conllevan un gran número de operaciones de escritura.

Su principal inconveniente es el coste que supone duplicar el número de discos necesarios para los datos.

Nivel 2

Con un único disco de paridad sólo se puede detectar un único error, pero si se está interesado en la recuperación de más errores son necesarios más discos adicionales. El número de discos extra en el nivel 2 de RAID varía desde 4 en un grupo de 10 discos, hasta 5 discos en un grupo de 25.

Este nivel cuenta con varios discos para bloques de redundancia y corrección de errores. La división es a nivel de bit y el acceso es simultáneo a todas las unidades tanto en operaciones de lectura como de escritura.

Nivel 3

El nivel 3 de RAID proporciona la seguridad de los datos gracias a la información de paridad almacenada en una única unidad dedicada, con lo que se logra una forma más eficaz de proporcionar redundancia de datos. En el nivel 3 de RAID los datos se dividen en fragmentos y se transfieren a los distintos discos que funcionan en paralelo, lo que permite enviar más datos de una sola vez y aumentar de forma sustancial la velocidad general de transferencia de datos. Esta última característica convierte a este nivel en idóneo para aquellas aplicaciones que requieren la transferencia de grandes ficheros contiguos hacia y desde el ordenador central.

No obstante, en aquellos entornos en los que muchos usuarios necesitan leer y escribir múltiples registros aleatorios, las peticiones de operaciones de entrada-salida simultáneas pueden sobrecargar y ralentizar el sistema. En el nivel 3 de RAID los discos participan en cada transacción, atendiendo cada petición de entrada-salida de una en una. Por consiguiente, el nivel 3 de RAID no es una opción adecuada para aplicaciones transaccionales, en las que la mayor parte del tiempo se emplea en buscar pequeños registros esparcidos aleatoriamente por los discos.

Nivel 4

En el nivel 4 de RAID los bloques de datos pueden ser distribuidos a través de un grupo de discos para reducir el tiempo de transferencia y explotar toda la capacidad de transferencia de datos de la matriz de discos. El nivel 4 de RAID es preferible al nivel 2 de RAID para pequeños bloques de datos, porque en este nivel, los datos son distribuidos por sectores y no por bits. Otra ventaja del nivel 4 de RAID frente a los niveles 2 y 3 es que al mismo tiempo puede estar activa más de una operación de lectura-escritura sobre el conjunto de discos.

El nivel 4 de RAID tiene división a nivel de bloques y el acceso al array de discos es paralelo, pero no simultáneo. Posee un disco dedicado a paridad y corrección de errores. La operación de escritura se realiza de forma secuencial y la de lectura en paralelo.

Nivel 5

En el nivel 5 de RAID las unidades de disco actúan independientemente. Cada unidad es capaz de atender a sus propias operaciones de lectura-escritura, lo que aumenta el número de operaciones de entrada-salida simultáneas. Esta característica mejora considerablemente el tiempo de acceso, especialmente con múltiples peticiones de pequeñas operaciones de entrada-salida.

El nivel 5 de RAID asegura un mejor rendimiento de operaciones de entrada-salida, para aplicaciones en las que el sistema realiza búsquedas aleatorias de muchos ficheros pequeños como sucede en las aplicaciones transaccionales. El nivel 5 de RAID ofrece la posibilidad de soportar múltiples operaciones de escritura, de forma que los datos pueden escribirse en un disco y su información de paridad en otro. En el nivel 5 de RAID no existe una unidad dedicada para paridad sino que el controlador intercala los datos y la paridad en todos los discos del subsistema.

El inconveniente de este nivel es que presenta una operación adicional de escritura al almacenar los datos, ya que tanto los datos como la información de paridad se actualizan en operaciones distintas y en unidades de disco diferentes. Por tanto, las aplicaciones que implican numerosas operaciones de escritura pueden sufrir descensos en el rendimiento. No obstante, otras unidades de la batería pueden seguir leyendo datos durante la operación de escritura, lo que contribuye a mejorar el rendimiento general de las operaciones de entrada-salida de la batería. Debido a la operación adicional de escritura de la información de paridad, el nivel 5 de RAID es el más apropiado para aplicaciones con un elevado número de operaciones de lectura respecto a las de escritura.

Nivel 6

El nivel 6 de RAID añade un nivel más de discos, resultando una organización con dos dimensiones de discos y una tercera que corresponde a los sectores de los discos. La ventaja de este nivel consiste en que no solamente se puede recuperar un error de entre dos discos, sino que es posible recuperar muchos errores de tres discos. La operación de escritura es difícil debido a la necesidad de sincronizar todas las dimensiones.

Esta organización funciona como el nivel 0 de RAID en cada una de las dos dimensiones de discos, y como el nivel 1 de RAID en la operación entre las dos dimensiones de discos. El acceso es simultáneo en cada una de las dimensiones independientes de discos.

Nivel 7

Como en el nivel 4, el nivel 7 de RAID los bloques de dato se encuentran distribuidos por discos y posee un disco dedicado a paridad. Las mayores diferencias con respecto al nivel 4 estriban en que la lectura/escritura se realiza de forma asíncrona y está centralizada sobre una caché vía un bus de alta velocidad, la cual a su vez integra la generación de la paridad.

Además posee un sistema operativo en tiempo real que controla la comunicación y sincronización entre los discos, que permite una gran velocidad de transferencia, pero con una baja fiabilidad.

En la siguiente tabla se presenta un resumen de los niveles RAID:

Nivel RAID	Aplicaciones	Ventajas	Inconvenientes
0	Altas prestaciones sin redundancia	Incremento velocidad de acceso	No resuelve el problema de la fiabilidad
1	Gran porcentaje de escritura sobre lectura	Alta disponibilidad	Coste de duplicar el almacenamiento y no mejora la velocidad de acceso
2	Menor porcentaje de escritura sobre lectura	Grabación de datosen distintos discos simultáneamente	División a nivel debit
3	Científicas	Más eficaz respecto nivel 2 al almacenar datos de redundancia	Muchas operaciones E/S sobrecargan y ralentizan el sistema
4	Pequeños bloques de datos	Permite que más de una operación E/S esté activa sobre los datos	Acceso en paralelo a los discos pero no simultáneo
5	Transaccionales	Cada disco actúa de forma independiente. Gran aumento de velocidad con pequeñas op. E/S	Descenso del rendimiento de operaciones de escritura
6	Cualquier tipo	Mejor disponibilidad	Alto coste y complejidad del sistema

3.2. Tendencias tecnológicas y del mercado

En este punto se describen las tendencias que existen en la industria y el mercado, en lo que se refiere a dispositivos de almacenamiento masivo de información.

La tendencia general de todos los dispositivos de almacenamiento masivo de información se dirige, por un lado al incremento continuo de la capacidad y, por otro, a obtener dispositivos más rápidos, más económicos, de menor tamaño y más fiables que los que están disponibles en la actualidad. De hecho, todo dispositivo que pretenda llegar a convertirse en un estándar, deberá tener un precio ajustado, rapidez, versatilidad y una gran capacidad de almacenamiento.

Para lograrlo, se están produciendo avances en el estudio de nuevos materiales, tanto para el desarrollo de los medios de soporte como para el desarrollo de los subsistemas de lectura-escritura (que apuntan a sistemas de almacenamiento óptico), en la investigación de nuevas técnicas de deposición de películas más finas (que permitirán la fabricación de medios magnéticos con densidades de grabación mucho mayores), etc.

También se está investigando en el uso de técnicas de filtrado adaptativo digital, como la PRML (Partial Response Maximun Likelihood), que permiten detectar los bits grabados a pesar de la interferencia intersimbólica (ISI) que se produce entre aquellos.

Con el uso de técnicas de este estilo, la distancia mínima que debe guardarse entre los distintos bits grabados puede ser reducida de modo importante. La aplicación de otras técnicas, conocidas como técnicas de superresolución,también permitirán incrementar la densidad de grabación de los dispositivos de almacenamiento reduciendo la distancia entre pistas.

Los medios de soporte para el almacenamiento de información que se anuncian como más prometedores son los que utilizan tecnologías óptica y magneto-óptica. Las tendencias en este sentido tienen dos vertientes: un descenso continuado del precio de estos dispositivos (CD-ROM, DVD, etc.) y un rápido crecimiento del mercado de estos, en competencia directa con los discos magnéticos.

Respecto a las necesidades de alta disponibilidad que se les exige a los dispositivos de almacenamiento masivo de información, la tecnología RAID ofrece niveles de prestaciones, capacidad y disponibilidad que sin ella difícilmente serían alcanzables, a un coste razonable.

3.3. ASPECTOS TECNICOS EN EL PROCESO DE ADQUISICION DE UNA UNIDAD DE ALMACENAMIENTO

En este capítulo se pretende dar la orientación suficiente al comprador para la preparación del conjunto de especificaciones que definirán los requisitos que han de cumplir las unidades de almacenamiento objeto de la adquisición.

Se realiza en primer lugar un análisis de las necesidades del comprador, a continuación se recogen los factores relevantes a tener en cuenta en el proceso de adquisición y, finalmente, se describe cómo deben ser planteadas las especificaciones técnico - funcionales para la elaboración del Pliego de Prescripciones Técnicas, qué normas, estándares y cláusulas tipo pueden ser de aplicación, y cuál es el cuestionario técnico diseñado para normalizar las ofertas y facilitar su evaluación.

3.4. Análisis de las necesidades del comprador

La decisión de adquirir una unidad de disco o cinta está influenciada por varios factores, la mayoría de los cuales están en correspondencia directa con las necesidades experimentadas por el usuario, y por las limitaciones o restricciones a las que debe ajustarse el dispositivo cuya adquisición se plantea.

El análisis de las necesidades existentes que deberán ser satisfechas por la unidad de disco o cinta que se piensa comprar es la primera etapa que tiene que abordarse de modo sistemático dentro del proceso de adquisición. Para ello, el comprador debe ser capaz de identificar los principales requisitos funcionales que tiene que cumplir el periférico, así como las principales limitaciones y restricciones a las que debe responder la unidad de almacenamiento, dependiendo del entorno de operación previsto en el que debe integrarse.

Esta primera etapa de análisis de necesidades está directamente relacionada con la etapa de especificación de las características técnico-funcionales del suministro a contratar. De hecho, en la práctica real ambas etapas se suelen realizar de modo simultáneo.

En los párrafos que siguen a continuación se señalan varios puntos de referencia funcional, en relación con los cuales el comprador deberá formular los requisitos de un modo explícito y suficientemente operativo.

El último paso en el diseño del Pliego de Prescripciones Técnicas será la traducción de estos requisitos (las necesidades del comprador) en especificaciones técnico-funcionales para la inclusión en dicho pliego.

En la etapa de análisis de necesidades deberán tenerse en cuenta todas aquellas necesidades, limitaciones y restricciones que afecten, entre otros, a los puntos siguientes:

Volumen de datos a almacenar

El primer factor que debe ser tenido en cuenta es el volumen de ocupación de los datos que van a almacenarse. Para realizar una estimación de los volúmenes de datos deberá tenerse en cuenta que la ocupación en bytes de un determinado dato depende no sólo de su longitud sino, y muy especialmente, de su tipo y de la técnica de representación utilizada (EBCDIC, ASCII...). Estos factores suelen depender directamente del marco de cada aplicación concreta. Por ejemplo, no ocupa el mismo espacio en bytes el almacenamiento de un dato numérico de tipo entero si se representa en binario o si se representa en código ASCII. Por otra parte, si se pretende almacenar ficheros binarios con imágenes digitalizadas, habrá que conocer el rendimiento de la técnica de compresión utilizada por el sistema.

Volumen de datos a transferir por unidad de tiempo

El segundo factor que debe ser tenido en cuenta es el volumen de datos que se van a transferir a la unidad de almacenamiento por unidad de tiempo. Ello obliga al comprador a realizar una estimación de los volúmenes de datos según sus diferentes tipos y la periodicidad de las transferencias, que dependerá lógicamente de la naturaleza y de las peculiaridades de cada aplicación concreta.

Memoria caché de disco

En entornos que se caracterizan por realizar accesos reiterados a los mismos datos, es interesante la disponibilidad de una memoria caché, especialmente cuando se necesite reducir considerablemente el tiempo medio de acceso. Con el uso de esta técnica, durante el proceso de escritura, el sistema copia los datos de la memoria principal a la memoriacaché y, al mismo tiempo, la unidad de almacenamiento empieza a situar los cabezales en la posición adecuada. En el momento en que los datos se han grabado en la memoria caché, el sistema continúa procesando otras informaciones, mientras los datos almacenados en la memoria caché se graban en el dispositivo de almacenamiento.

Naturaleza de las aplicaciones y factores críticos de las mismas (tipos de funciones que se realizarán predominantemente)

Otro factor de gran importancia es la naturaleza de las aplicaciones que se van a explotar sobre las unidades de disco o cinta en cuestión, y la existencia de posibles factores críticos.

Esto es especialmente importante, y por lo tanto debe ser tenido muy en cuenta, en los denominados entornos transaccionales, en los que las aplicaciones suelen hacer un uso intensivo de las unidades de almacenamiento, especialmente de las unidades de disco. Esto se debe fundamentalmente a que en entornos de proceso transaccional se requiere por lo general múltiples accesos a la unidad de almacenamiento, de tal modo que el rendimiento global del sistema puede estar más condicionado por el comportamiento de este dispositivo que por el de la unidad central de proceso.

Pero las aplicaciones pueden exhibir otros factores críticos y peculiaridades propias que condicionarán las características técnicas de las unidades de almacenamiento que se vayan a adquirir, como pueden ser los tiempos máximos admisibles en operaciones de lectura y escritura en las unidades de disco o cinta, o ciertas características de los procesos de salvaguarda.

Requisitos de fiabilidad e inmunidad frente a fallos

Relacionado con los factores anteriores se encuentra el análisis del grado de fiabilidad o inmunidad frente a fallos exigible al sistema. Pueden existir aplicaciones o entornos de operación muy restrictivos en ese sentido, donde el buen funcionamiento de una instalación exige la absoluta disponibilidad de todos sus componentes.

Integrabilidad con otros sistemas informáticos existentes en el entorno de operación

Aparte de las necesidades funcionales de los usuarios, el comprador de una unidad de almacenamiento de información deberá tener en cuenta una serie de cuestiones importantes sobre el entorno de operación existente o previsible, muy especialmente en cuanto a la naturaleza de los equipos y sistemas con los que deberá garantizarse la compatibilidad o interoperatividad.

Tiempo de recuperación de los datos contenidos en unidades de salvaguarda

Con unidades de salvaguarda implementadas con sistemas automatizados de cintas es muy importante que el usuario determine cuál es el tiempo máximo permisible de recuperación de los datos contenidos en las cintas.

Disponibilidad teórica de los equipos

Dos de los parámetros que se deben analizar en el momento de la solicitud de ofertas de un sistema de almacenamiento masivo de información son su disponibilidad, medida como el tiempo medio entre fallos (MTBF, Mean Time Between Failures, tiempo medio entre fallos), y la duración total de sus reparaciones (MTTR, Mean Time To Repair, tiempo medio hasta la reparación), medida como el tiempo medio de la reparación desde la presencia de la alarma, contando desplazamientos del personal y la duración de la reparación de la unidad averiada.

Todos los elementos críticos de un sistema de información, como pueden ser una unidad de almacenamiento, deben estar protegidos por sistemas de seguridad y redundancia que sigan asegurando el correcto funcionamiento de estos sistemas ante cualquier fallo.

Otro factor a tener en cuenta es la existencia de sistemas con los que sea posible recuperar y volver a cargar los datos que contenían las unidades de almacenamiento antes de su caída.

Mantenimiento

Deberá tenerse en cuenta el período de tiempo durante el cual, es conveniente que el dispositivo esté cubierto por el servicio de garantía del fabricante.

Características físicas del entorno de operación

En el mismo sentido que el punto anterior se deberán tener en cuenta las posibles restricciones o limitaciones de carácter eléctrico, mecánico y ambiental presentes en el citado entorno.

Consumo de potencia

Esta característica determina el consumo de potencia que tienen estos dispositivos y que deberá suministrarle su propia fuente de alimentación, externa al sistema por tanto, o la propia fuente de alimentación del sistema.

Dimensiones

El tamaño es una característica importante en muchas ocasiones, especialmente cuando la disponibilidad de espacio está muy limitada o cuando se trate de dispositivos para su instalación en el interior de la carcasa del ordenador.

Nivel de ruidos

Con este parámetro se determina el nivel de ruido que se produce durante la lectura y escritura de información en estos dispositivos.

Disipación de calor

Esta característica evalúa el nivel de calor que disipan estos dispositivos durante su operación normal.

Factores humanos en el entorno de operación

Dentro de los factores humanos propios del entorno de operación, y que deben ser tenidos en cuenta durante esta etapa, figuran las necesidades de cualificación y experiencia de los operadores, así como las facilidades para operadores discapacitados, u otros tipos de restricciones.

En resumen, el comprador debe ser capaz de analizar y especificar de la forma más concreta posible sus necesidades en relación con todos estos puntos. Téngase en cuenta que la elección de una unidad de almacenamiento de disco o cinta puede condicionar las prestaciones y servicios ofrecidos por una instalación de tratamiento de la información.

TEMA 1: LA INFORMÁTICA Y SU EVOLUCIÓN

1. - EL TRATAMIENTO DE LA INFORMACIÓN

El concepto de informática se puede definir como el tratamiento automático de la información por medio de ordenadores.

El procesamiento de datos, se puede dividir en tres fases:

Fase de entrada: Los datos son introducidos por el usuario mediante el teclado.
Fase de proceso: El ordenador comienza su tratamiento mediante los programas. Un programa es un conjunto de ordenes que indican al ordenador lo que tiene que hacer.
Fase de salida: Los resultados se muestran al usuario.

Proceso electrónico de datos:

Los sistemas informáticos se dividen en dos partes, la parte física (hardware) y la lógica (software):

Hardware: Esta compuesto por los elementos físicos.
Software: Es el conjunto de programas que permite controlar el funcionamiento del ordenador.

2. -HISTORIA DE LA INFORMÁTICA

El primer instrumento que se utilizó para el cálculo fue el ábaco. Lo inventaron los chinos y lo utilizaron los romanos hasta el siglo IV a. C.

En 1645 Blaise Pascal construyó una máquina para sumas y restas que estaba compuesto de ruedas dentadas que al girar permitían obtener el resultado de la operación. En 1675 Von Leibniz construyó otra capaz de realizar las cuatro operaciones básicas.

El primer precedente de los ordenadores apareció 1837 cuando Charles Babbage inició los esquemas de una máquina controlada por relojes. Sin embargo nunca llegó a construirse por su complejidad.

La primera máquina capaz de hacer cálculos la construyó Herman Hollerith. Era de tipo electromecánico. Éstas se fueron perfeccionando hasta llegar a la construcción del MARK-I por Howard H. Aiken.

A partir de este momento la evolución de los ordenadores va por generaciones que se distinguen por los componentes del ordenador y la forma de realizar el tratamiento de la información.

Primera generación (1946-1955)

En este periodo los ordenadores eran construidos a base de válvulas de vacío y relés electromagnéticos.

El procesador era secuencial. Las tarjetas perforadas introducían los datos.

Al comienzo de esta época se construyó el ENIAC que utilizaba alrededor de 19.000 válvulas de vacío y 1.500 relés. Ocupaba una gran habitación y solo trabajaba con veinte números de diez dígitos.

Segunda generación (1955-1964)

Aparece el transistor sustituyendo las válvulas de vacío. Los transistores son mucho más pequeños, desprenden menos calor y se averían menos. Por ello los ordenadores han ido reduciendo su tamaño. En este periodo se construyó el UNIVAC 1100.

Tercera generación (1964-1970)

Comienzan a utilizarse los circuitos integrados, formados por miles de transistores conectados entre sí e insertados en un solo chip. Los ordenadores, que ya permiten ejecutar varios programas a la vez, reducen aún más su tamaño y aumenta su velocidad de cálculo.

Comienza a estandarizarse los programas para crear software, como el Fortran, el Basic y el Pascal.

Cuarta generación (1970-1980)

Aparecen nuevos circuitos con mayor nivel de integración, por lo que los ordenadores reducen aún más su tamaño.

En este periodo la empresa Intel desarrolla su primer microprocesador. Aparecen nuevos entornos y lenguajes de programación como el C y el Prolog.

Quinta generación ( a partir de 1981)

En 1981 IBM construyó el primer ordenador personal y revolucionó el mercado informático.

La utilización de circuitos con mayor nivel de integración, la bajada de precios y el continuo aumento de prestaciones y servicios generalizan la difusión del ordenador.

El uso masivo de ordenadores genera la necesidad de comunicarlos, provocando la aparición de las redes como Internet.

3. -LA REPRESENTACIÓN DE LA INFORMACIÓN

La información que maneja el ser humano se representa por una combinación de números que forman cantidades y se emplea el sistema métrico decimal, y una combinación de letras que forman palabras y se emplea el abecedario español.

Sin embargo el ordenador puede representar solo dos estados (encendido y apagado). Es como un interruptor. El sistema binario es el que emplean todos los ordenadores, pues encendido se representa con 1 y apagado con 0.

Representación de cantidades

El ser humano emplea un sistema de numeración llamado decimal.

La regla principal indica que toda cantidad se puede representar por el desarrollo de potencias sucesivas que tendrán como base el número total de dígitos usado por el sistema que se esté utilizando y como exponente el lugar físico que ocupe cada dígito menos uno empezando por la derecha.

Desarrollo polinómico de una cantidad es la suma de los productos de cada uno de los dígitos con la potencia que les corresponde ofrecerá el valor real de la base de numeración. Por ejemplo, el desarrollo polinómico en base 10 del número 634 sería:

634(10 = 6 x 102 + 3 x 101 + 4 x 100 = 600 + 30 + 4

El ordenador utiliza el sistema binario. Las cantidades se representarán como combinaciones de ceros y unos. Para conocer la cantidad en base decimal que representa una combinación de ceros y unos bastará con realizar su desarrollo polinómico al igual que en el ejemplo anterior. Por ejemplo, para conocer qué cantidad representará 10101, sería:

10101(2 = 1 x 24 + 0 x 23 + 1 x 22 + 0 x 21 + 1 x 20 =

= 16 + 0 + 4 + 0 + 1 =21(10

El método para pasar del sistema binario al decimal es muy fácil. ¿Será viceversa también fácil? El método también es sencillo.

Para pasar una cantidad del sistema decimal al binario se realizan divisiones sucesivas por dos. Primero se toma la cantidad decimal y se divide por dos, después se toma el cociente de esa división y se vuelve a dividir por dos, tomamos de nuevo el cociente de la última división y lo dividimos por dos, y así sucesivamente hasta que el cociente ya no sea divisible entre dos. El número binario estará formado por el último cociente y los restos de las sucesivas divisiones empezando por el de la última, hasta llegar al resto de la primera división.

El ordenador trabaja internamente en binario, así si el usuario escribe una cantidad por teclado, esta cantidad es convertida en binario para que el ordenador trabaje. Por el contrario cuando el ordenador muestra un resultado al usuario, el número binario pasa a decimal y después se muestra en el monitor o se imprime.

Representación de palabras

Cuando leemos un texto, se puede apreciar que es articulado. Sin embargo, también se puede observar que las letras pueden mayúsculas o minúsculas y que utilizan espacios en blanco, signos de puntuación, etc. Pero, ¿cómo se representan todos estos símbolos con sólo unos ceros? La solución es la codificación.

El ordenador solo utiliza el sistema binario. Bit es la unidad mínima de información que se pude representar (0 ó 1). Con un solo bit solo se pueden representar dos estados, 0 y 1. Sin embargo, con 2 bits se representarán 4 estados, y así sucesivamente. El número de estados posibles se corresponde con el número de bits utilizados

(N.º de estados = 2 número de bits)

Si utilizamos 7 bits, se podría representar 27 = 128 estados, se queda pequeño. Si utilizamos 8 bits, se podrían representar 28 = 256 estados, que permiten representar todos los símbolos. Luego, ésta es la solución. Para representar un carácter, se necesitan 8 bits y a este grupo de 8 bits se le denomina byte. Luego un carácter se puede representar con un byte.

Ahora solo queda asignar a cada carácter una combinación de ocho ceros y unos que la represente. Es el utilizado por todos los ordenadores personales, denominado Código ASCII (American Standar Code for Information Interchange oCódigo Estándar Americano para el Intercambio de Información.

Cuando el usuario teclea una letra, ésta se transforma en el código binario correspondiente a ese carácter ASCII y cuando debe mostrar una letra, transforma el código binario al correspondiente carácter antes de sacarlo por el monitor o por la impresora.

4. - ESCALA DE MAGNITUDES

En informática, la longitud más pequeña empleada es el bit, que hemos definido como la unidad mínima de información. Sin embargo, la más utilizada es el byte, también llamado octeto, que está compuesto por ocho bits y nos permite representar un carácter. Hablar de un byte en informática, es lo mismo que hablar de un gramo en peso o de un metro en longitud. Cuando alguien se pesa no dice que pesa cincuenta mil gramos, sino cincuenta kilos, es decir, se ha establecido una escala de magnitudes de forma que sea más fácil manejar grandes cantidades. Nadie habla de miles de metros, sino de kilómetros. Lo mismo ocurre en informática. Para trabajar con grandes cantidades aparecen nuevas magnitudes que nos facilita el trabajo. Las más utilizadas son el kilobyte, el Megabyte y el Gigabyte.

Magnitud	Símbolo	Equivalencia
1 byte	B	8 bits
1 Kilobyte	Kb	1.024 bytes
1 Megabyte	Mb	1.024 kilobytes
1 Gigabyte	Gb	1.024 gigabytes

La tabla anterior indica la correspondencia exacta entre unas magnitudes y otras, 1 Kilobyte es igual a 210 = 1024 bytes. Sin embargo, en la práctica, el valor 1.024 se suele aproximar a 1.000 para facilitar las operaciones.

Como sabemos que 1 Megabyte son 1.024 Kilobytes; 4 Megabytes serán cuatro veces más:

1 Mb = 1.024 Kb ! 4 Mb = 4 x 1.024 Kb = 4.096 Kb

También sabemos que 1 Kilobyte son 1.024 bytes, luego podemos obtener:

1 Kb = 1.024 B ! 4.096 Kb = 4.096 x 1.024 B = 4.194.304 B

5. - El software

Software viene de la palabra inglesa soft, que significa blando. La palabra software se utiliza para designar a la parte lógica del ordenador. Se llama parte lógica al conjunto de programas que se emplean para dirigir y controlar el funcionamiento del ordenador.

El software se clasifica en tres grandes grupos, dependiendo de los objetivos para los que haya sido creado: el softwarede sistemas, el de programación y el de aplicación.

El software de sistemas

El software de sistemas está formado por los programas que se encargan de controlar, coordinar y gestionar todo elhardware del ordenador. Estos programas reciben el nombre de sistemas operativos y actúan como intermediarios entre los componentes físicos del ordenador y el usuario.

Los sistemas operativos se clasifican según el tipo de comportamiento que proporcionan al ordenador, por ejemplo según el número de programas que el ordenador puede ejecutar a la vez. Si el ordenador solo puede trabajar con un programa cada vez, se dice que es un sistema operativo monotarea; por el contrario, se permite que varios programas se ejecuten de forma simultánea, entonces se denomina multitarea.

Además, los sistemas operativos también se clasifican según el número de usuarios que pueden trabajar con el ordenador de forma simultánea. Si sólo puede trabajar un usuario con él se le denomina monousuario, pero, si pueden trabajar varios a la vez, se le llama multiusuario.

Entre los principales sistemas operativos se pueden destacar:

• MS-DOS. Con este sistema operativo de la empresa Microsoft apareció el primer PC (Personal Computer: ordenador personal) de IBM en el año 1981. Aún hoy, tras numerosas revisiones, sigue siendo el más utilizado en el mundo de los ordenadores personales. Es un sistema operativo monousuario y monotarea que permite manejar el ordenador de una forma sencilla.

• OS/2. Este sistema operativo creado por IBM apareció en el año 1987. Es el primer sistema diseñado para ordenadores personales que permite trabajar en multitarea y en monousuario. Trabaja mediante una interfaz gráfica que facilita su utilización, y además tiene un módulo que es compatible con MS-DOS, de forma que el usuario pueda ejecutar los programas preparados para este sistema operativo.

• Windows 95. Este sistema operativo de la empresa Microsoft apareció en el mercado en el año 1995. El sistema permite trabajar en modo multitarea y monousuario. Dispone de una interfaz gráfica mediante ventanas que facilita al usuario la utilización del ordenador. Este sistema también es compatible con MS-DOS.

• UNIX. Este sistema operativo tiene numerosos nombres, en función de la empresa que lo comercializa. Por ejemplo: AIX (versión de IBM), Xenix (Versión de Microsoft), Simix (versión de Siemens), Linux, Unix, Sco, etc. Este sistema es multitarea y multiusuario y puede ser ejecutado en un ordenador personal o en un gran ordenador central con numerosas pantallas. UNIX se suele utilizar en las grandes empresas, donde se necesita que varios empleados estén trabajando a la vez con la misma información, por ejemplo, en los bancos.

El software de programación

El software de programación reúne los programas que utilizan los programadores para crear nuevos programas. Los programas se crean utilizando un lenguaje de programación que es un conjunto de palabras clave o instrucciones y unas reglas sintácticas que indican como hacer los programas.

Existen numerosos lenguajes de programación y cada uno tiene sus propias instrucciones y sus propias reglas.

Los lenguajes de programación se clasifican como sigue:

• Lenguajes de bajo nivel. Se llaman de bajo nivel porque están muy cercanos al hardware del ordenador. Es necesario conocer a fondo la arquitectura de la máquina para la que se va a programar.

El primer lenguaje en este tipo que se utilizó fue el lenguaje máquina, que consiste en un conjunto de instrucciones en binario, es decir, con ceros y unos, con los cuales se indica al ordenador que hacer. Este lenguaje es muy complicado y la posibilidad de cometer errores es muy alta por lo que ya no se utiliza.

Para solventar estas dificultades apareció el lenguaje ensamblador, que consiste en asignar una abreviaturas a cada instrucción en binario, de forma que sea más fácil recordarla y más difícil equivocarse. Sin embargo, con este lenguaje sigue siendo necesario conocer muy bien el hardware del ordenador.

• Lenguajes de alto nivel. Se llaman de alto nivel porque están más cerca del programador que del hardware de la máquina. Para utilizar estos lenguajes es necesario conocer a fondo el ordenador. Las instrucciones de estos lenguajes usan palabras que se utilizan para hablar normalmente por supuesto, en inglés.

Algunos de esos lenguajes son: Cobol, Basic, Pascal, C, Ada, Fortran, Prolog, Lisp, etc.

Los programas creados con estos lenguajes necesitan ser traducidos a lenguaje máquina (ceros y unos) para que puedan ser entendidos por el ordenador.

Para realizar esa traducción se emplea los intérpretes y los compiladores:

Intérpretes: El intérprete toma el programa creado por el lenguaje de alto nivel llamado programa fuente y lo va traduciendo y ejecutando instrucción a instrucción. La ventaja que tiene es que si el programa tiene errores permitirá al programador corregirlo sobre la marcha y continuar la ejecución. El inconveniente es que cada vez que se desea ejecutar el programa es necesario volver a traducirlo.
Compiladores. El compilador primero traduce todas las opciones del programa fuente y crea un programa traducido a lenguaje máquina llamado programa objeto. La ventaja que tiene es que el programa objeto podrá ser ejecutado todas las veces que quiera el usuario sin tener que realizar una traducción.

El software de aplicación

El software de aplicación es el conjunto de programas que utilizan los usuarios para trabajar con el ordenador. Estos programas están creados con lenguaje de programación y se ejecutan sobre un determinado sistema operativo.

El software de aplicación se clasifica en programas verticales y programas horizontales o de depósito general.

• Programas verticales. Son aquellos que resuelven problemas concretos y han sido diseñados para cumplir una misión específica. Cuando estos programas son encargados por los clientes a las empresas productoras de software, entonces se dice que se ha creado un programa a medida, es decir, para cubrir las necesidades específicas de un cliente.

• Programas horizontales o de propósito general. Son aquellos que sirven para realizar tareas de carácter amplio y general y que pueden ser utilizados por la mayoría de los usuarios de un ordenador personal. Estos programas, también llamados estándar, pueden ser clasificados según su función en procesadores de texto, hojas de cálculo, bases de datos, paquetes integrados, diseño gráfico y autoedición.

Procesadores de texto. Están diseñados para la elaboración de documentos. Inicialmente simulaban la utilización de una máquina de escribir, pero en la actualidad permiten realizar funciones mucho más complejas, como insertar gráficos en el texto, hacer correcciones ortográficas, buscar sinónimos, etc. Entre ellos podemos destacar: Word, Word Perfect y Ami Pro.
Hojas de cálculo. Han sido creadas para trabajar con gran cantidad de datos numéricos y realizar operaciones de cálculo complejas. Permiten obtener gráficos a partir de los datos introducidos y de los valores calculados. Entre las hojas de cálculo destacan Excel, Lotus123 y Quatro Pro.
Bases de datos. Permiten manipular información de distinto tipo mediante fichas que pueden ser consultadas, modificadas y actualizadas por el usuario. Las más utilizadas son Dbase, Access, Paradox y Oracle.

Paquetes integrados. Son programas creados para reunir en una sola aplicación las características fundamentales de los tres anteriores: el procesador de textos, la hoja de cálculo y la base de datos. Además, siempre suelen añadir un programa de comunicaciones que nos permite conectarnos con otros ordenadores por medio de la línea telefónica. La gran ventaja de los paquetes integrados es que se puede compartir información entre los programas.
Diseño gráfico. Son los programas dedicados a la elaboración y manipulación de imágenes. Son utilizados para crear carteles publicitarios, hacer retoques fotográficos, logotipos, etc. Los más conocidos son Corel Draw, Photoshop y FreeHand.
Autoedición. Son programas creados para componer revistas y periódicos uniendo textos e imágenes. Destacan los programas PageMaker y QuarkXPress.

6.- Normativa legal del sector informático

La primera referencia a la propiedad informática que existe en la normativa legal en nuestro país, se encuentra en el año 1983 en la Ley de Propiedad Intelectual.

Esta Ley se encuentra falta de conceptos propios del campo de la informática, que se suple con la aceptación por la normativa española y la aprobación por parte del Parlamento español, de la Directiva del Consejo de la CEE del 14 de mayo de 1991, que trata sobre la Protección Jurídica de Programas de Ordenador, cuya base es la Ley de Protección Intelectual.

Derechos y deberes

La nueva ley de Protección Jurídica de Programas de Ordenador se compone de nueve artículos. Estos artículos aumentan las medidas para proteger los programas informáticos. El principio fundamental de esta ley consiste en tratar los programas como obras literarias.

Para que los programas estén protegidos dentro de la normativa tienen que ser originales, considerándose como unacreación intelectual de su autor. Esta nueva normativa protege no la idea principal del programa sino la forma y la originalidad en que se desarrolla la idea.

En esta normativa se establece que los derechos de explotación del programa en los apartados de reproducción, distribución, comunicación pública y transformación son exclusivamente propiedad del autor, estableciéndose un plazo de 50 años de duración del derecho de explotación.

La piratería informática

Todas las condiciones para la realización de un proyecto informático deben ser recogidas dentro de un contrato. Este contrato, además de detallar las condiciones fundamentales de todo tipo de contrato (fecha de entrega, condiciones económicas, etc.), deberá reseñar el número de copias que se permite realizar al comprador. Si no se indica ninguna cantidad, el comprador estará autorizado a hacer una sola copia de los discos originales. Esta copia podrá ser usada solo en caso de deterioro de los originales, considerándose como ilegal cualquier otra copia, así como un incumplimiento del contrato o licencia de uso infligiendo la normativa vigente.

La Ley de Protección Jurídica de Programas de Ordenador, establece tres tipos de infractores:

Aquellos que pongan en circulación una o más copias de programa de ordenador conociendo su naturaleza ilegítima.
Aquellos que posean con fines comerciales y económicos una o más copias de un programa de ordenador careciendo de las correspondientes licencias.
Aquellos que pongan en circulación o posean con fines comerciales y económicos cualquier medio cuyo único uso sea facilitar la eliminación o neutralización de cualquier dispositivo técnico utilizado para la protección de un programa de ordenador.

Cualquier derivación de los tres puntos anteriores infringe la normativa vigente y se considera delito conocido comopiratería informática.

Jordy Perez

miércoles, 30 de mayo de 2012

Sistemas de almacenamiento y evolución de la informática

No hay comentarios:

Publicar un comentario

Datos personales