white & Black


Discos Rígidos

 

Disco rígido, disco duro, (popularmente também conhecido por winchester) ou HD (do inglês Hard Disk) é a parte do computador onde são armazenadas as informações, ou seja, é a "memória permanente" propriamente dita (não confundir com "memória RAM"). É caracterizado como memória física, não-volátil, que é aquela na qual as informações não são perdidas quando o computador é desligado.

O disco rígido é um sistema lacrado contendo discos de metal cobertos por material magnético onde os dados são gravados através de cabeças, e revestido externamente por uma protecção metálica que é presa a caixa do computador por parafusos. É nele que normalmente gravamos dados (informações) e a partir dele lançamos e executamos nossos programas mais usados.

Este sistema é necessário porque o conteúdo da memória RAM é apagado quando o computador é desligado. Desta forma, temos um meio de executar novamente programas e carregar arquivos contendo os dados da próxima vez em que o computador for ligado. O disco rígido é também chamado por memória secundária. Nos sistemas operativos mais recentes, o disco rígido é também utilizado para expandir a memória RAM, através da gestão de memória virtual.

Existem vários tipos de discos rígidos diferentes: IDE/ATA, Serial_ATA, SCSI, Fibre channel.

 

 

 

Como os dados são gravados e lidos

Os discos magnéticos de um disco rígido são cobertos por uma camada magnética extremamente fina. Na verdade, quanto mais fina for a camada de gravação, maior será sua sensibilidade, e consequentemente maior será a densidade de gravação permitida por ela. Poderemos então armazenar mais dados num disco do mesmo tamanho, criando HDs de maior capacidade.

Os primeiros discos rígidos, assim como os discos usados no início da década de 80, utilizavam a mesma tecnologia de mídia magnética utilizada em disquetes, chamada coated media, que além de permitir uma baixa densidade de gravação, não é muito durável. Os discos actuais já utilizam mídia laminada (plated media); uma mídia mais densa, de qualidade muito superior, que permite a enorme capacidade de armazenamento dos discos modernos.

A cabeça de leitura e gravação de um disco rígido funciona como um electroíman. Sendo composta de uma bobina de fios que envolvem um núcleo de ferro. A diferença é que num disco rígido, este electroíman é extremamente pequeno e preciso, a ponto de ser capaz de gravar faixas medindo menos de um centésimo de milímetro.

Quando estão sendo gravados dados no disco, a cabeça utiliza o seu campo magnético para organizar as moléculas de óxido de ferro da superfície de gravação, fazendo com que os pólos positivos das moléculas fiquem alinhados com o pólo negativo da cabeça e, consequentemente, com que os pólos negativos das moléculas fiquem alinhados com o pólo positivo da cabeça. Usamos neste caso a velha lei “os opostos se atraem”.

Como a cabeça de leitura e gravação do HD é um electroíman, a sua polaridade pode ser alternada constantemente. Com o disco a girar continuamente, variando a polaridade da cabeça de gravação, variamos também a direcção dos pólos positivos e negativos das moléculas da superfície magnética. De acordo com a direcção dos pólos, temos um bit 1 ou 0.

Para gravar as sequências de bits 1 e 0 que formam os dados, a polaridade da cabeça magnética é mudada alguns milhões de vezes por segundo, sempre seguindo ciclos bem determinados. Cada bit é formado no disco por uma sequência de várias moléculas. Quanto maior for a densidade do disco, menos moléculas serão usadas para armazenar cada bit e teremos um sinal magnético mais fraco. Precisamos então de uma cabeça magnética mais precisa.

Quando é preciso ler os dados gravados, a cabeça de leitura capta o campo magnético gerado pelas moléculas alinhadas. A variação entre os sinais magnéticos positivos e negativos gera uma pequena corrente eléctrica que caminha através dos fios da bobina. Quando o sinal chega na placa lógica do HD, ele é interpretado como uma sequência de bits 1 e 0.

Vendo desta maneira, o processo de armazenamento de dados em discos magnéticos parece ser simples, e realmente era nos primeiros discos rígidos (como o 305 RAMAC da IBM), que eram construídos de maneira praticamente artesanal. Apesar de nos discos modernos terem sido incorporados vários aperfeiçoamentos, o processo básico continua sendo o mesmo.

 

Formatação do disco

Para que o sistema operacional seja capaz de gravar e ler dados no disco rígido, é preciso que antes sejam criadas estruturas que permitam gravar os dados de maneira organizada, para que eles possam ser encontrados mais tarde. Este processo é chamado de formatação.

Existem dois tipos de formatação, chamados de formatação física e formatação lógica. A formatação física é feita apenas na fábrica ao final do processo de fabricação, e consiste em dividir o disco virgem em trilhas, sectores e cilindros. Estas marcações funcionam como as faixas de uma estrada, permitindo à cabeça de leitura saber em que parte do disco está, e onde ela deve gravar dados. A formatação física é feita apenas uma vez, e não pode ser desfeita ou refeita através de software.

Porém, para que este disco possa ser reconhecido e utilizado pelo sistema operacional, é necessária uma nova formatação, chamada de formatação lógica. Ao contrário da formatação física, a formatação lógica não altera a estrutura física do disco rígido, e pode ser desfeita e refeita quantas vezes for preciso, através do comando FORMAT do DOS por exemplo. O processo de formatação, é quase automático, basta executar o programa de formatação que é fornecido junto com o sistema operacional.

Quando um disco é formatado, ele simplesmente é organizado “do jeito” do sistema operacional, preparado para receber dados. A esta organização damos o nome de “sistema de arquivos”. Um sistema de arquivos é um conjunto de estruturas lógicas e de rotinas que permitem ao sistema operacional controlar o acesso ao disco rígido. Diferentes sistemas operacionais usam diferentes sistemas de arquivos.

Exemplos de sistema de arquivos

Os sistemas de arquivos mais conhecidos são os utilizados pelo Microsoft Windows: NTFS e FAT32 (e FAT ou FAT16). O FAT32, às vezes referenciado apenas como FAT (erradamente, FAT é usado para FAT16), é uma evolução do ainda mais antigo FAT16 introduzida a partir do Windows 95 OSR/2 (ERRADO, no Windows 95 ORS/2, foi introduzido o FAT32, o FAT16 provem do MS-DOS 4.0) (uma versão “debugada” do Windows 95, com algumas melhorias, vendida pela Microsoft apenas em conjunto com computadores novos). A partir do Windows NT foi introduzido um novo sistema de arquivos, o NTFS, que é muito superior ao FAT (a nível de segurança, sacrificando alguma performance), sendo a mais notável diferença o recurso de permissões de arquivo (sistemas multi-usuário), inexistente nos sistemas FAT e essencial no ambiente empresarial.

Em resumo, versões antigas, mono-usuário, como Windows 95, 98 e ME, trabalham com FAT32 (mais antigamente, FAT16). Já versões novas, multi-usuário, como Windows XP e 2000 trabalham primordialmente com o NTFS, embora o sistema FAT seja suportado e você possa criar uma partição FAT nessas versões.

No mundo Linux existe uma grande variedade de sistemas de arquivos, sendo alguns dos mais comuns o Ext2, Ext3 e o ReiserFS. O FAT também é suportado, e o NTFS também, mas apenas para leitura, sendo o suporte a escrita ainda experimental.

Sector de boot

Quando o micro é ligado, o BIOS (um pequeno programa gravado em um chip na motherboard, que tem a função de “dar a partida no micro”), tentará iniciar o sistema operacional. Independentemente de qual sistema de arquivos você esteja usando, o primeiro sector do disco rígido será reservado para armazenar informações sobre a localização do sistema operacional, que permitem ao BIOS “achá-lo” e iniciar seu carregamento.

No sector de boot é registrado qual sistema operacional está instalado, com qual sistema de arquivos o disco foi formatado e quais arquivos devem ser lidos para iniciar o micro. Um sector é a menor divisão física do disco, e possui sempre 512 bytes. Um cluster (também chamado de agrupamento) é a menor parte reconhecida pelo sistema operacional, e pode ser formado por vários sectores. Um arquivo com um número de bytes maior que o tamanho do cluster, ao ser gravado no disco, é distribuído em vários clusters. Porém um cluster não pode pertencer a mais de um arquivo.

Um único sector de 512 bytes pode parecer pouco, mas é suficiente para armazenar o registro de boot devido ao seu pequeno tamanho. O sector de boot também é conhecido como “Faixa MBR”, “Faixa 0”, etc.

Como foi dito, no disco rígido existe um sector chamado MBR (Master Boot Record), que significa “Registro de Iniciação Mestre”, onde é encontrada a tabela de partição do disco que dará boot. O MBR é lido pelo BIOS, que interpreta a tabela de partição e em seguida carrega um programa chamado “bootstrap”, que é o responsável pelo carregamento do Sistema Operacional, no sector de boot da partição que dará o boot.

O MBR e a tabela de partição ocupam apenas um sector de uma faixa, o restante dos sectores desta faixa não são ocupados, permanecendo vazios e inutilizáveis, servindo como área de protecção do MBR. É nesta mesma área que alguns vírus (Vírus de Boot) se alojam.

Disquetes, Zip-disks e CD-ROMs não possuem MBR nem tabela de partição. Estes são exclusivos dos discos rígidos.História do disco rígido 

História do disco rígido

Sem dúvida, o disco rígido foi um dos componentes que mais evoluíram na história da computação. O primeiro disco rígido foi construído pela IBM em 1957, e era formado por nada menos que 50 discos de 24 polegadas de diâmetro, com uma capacidade total de 5 megabytes, incrível para a época. Este primeiro disco rígido foi chamado de 305 RAMAC (Random Access Method of Accounting and Control). Em 1973 a IBM lançou o modelo 3340 "Winchester", com dois pratos de 30 megabytes e tempo de acesso de 30 milissegundos. Assim criou-se o termo 30/30 Winchester (uma referência à espingarda Winchester 30/30), termo muito usado ainda hoje para designar HDs de qualquer espécie. Ainda no início da década de 1980, os discos rígidos eram muito caros e modelos de 10 megabytes custavam quase 2.000 dólares americanos, enquanto hoje compramos modelos de 160 gigabytes por menos de 100 dólares. Ainda no começo dos anos 80, a mesma IBM fez uso de uma versão pack de discos de 80 mb, usado no sistemas IBM Virtual Machine.

Capacidade do disco rígido

A capacidade de um disco rígido actualmente disponível no mercado para uso doméstico/comercial varia de 40 a 500 GB, mas um HD para empresas pode variar até 1 TB. O HD evoluiu muito. O mais antigo possuía 5 MB (aproximadamente 4 disquetes de 3 1/2 HD), sendo aumentada para 30 MB, em seguida para 500 MB (20 anos atrás), e 10 anos mais tarde, HDs de 1 a 3 GB. Em seguida lançou-se um HD de 10 GB e posteriormente um de 15 GB. Posteriormente, foi lançado no mercado um de 20 GB, até os actuais HDs de 40 e 500 GB. As empresas usam maiores ainda: variam de 40 GB até 1 TB, mas a Seagate informou que em 2010 irá lançar um HD de 200 TB (sendo 50 TB por polegada quadrada, contra 70 GB dos actuais HDs). No entanto, as indústrias consideram 1 GB = 1000 * 1000 * 1000 bytes, pois no Sistema Internacional de Unidades(SI), que trabalha com potências de dez, o prefixo giga quer dizer * 10003 ou * 109, enquanto os sistemas operacionais consideram 1 GB = 1024 * 1024 * 1024 bytes, já que os computadores trabalham com potências de dois e 1024 é a potência de dois mais próxima de mil. Isto causa uma certa disparidade entre o tamanho informado na compra do HD e o tamanho considerado pelo Sistema Operacional, conforme mostrado na tabela abaixo.

 

Informado na Compra

Considerado pelo Sistema

10 GB

9,31 GB

15 GB

13,9 GB

20 GB

18,63 GB

30 GB

27,94 GB

40 GB

38,2 / 37,25 GB

80 GB

74,51 GB

120 GB

111,76 GB

160 GB

149,01 GB

200 GB

186,26 GB

300 GB

279,4 GB

Toda a vez que um HD é formatado, uma certa quantidade de espaço é marcada como utilizada.

RAID

Redundant Array of Independent Disks, Conjunto Redundante de Discos Independentes ou mais conhecido como simplesmente RAID, é um meio de se criar uma unidade virtual composta por vários discos individuais, com a finalidade de duplicação (redundância, recuperação de falhas) ou balanceamento (operações I/O em paralelo).

A primeira ideia de RAID foi desenvolvida pela IBM em 1978, para melhorar a confiança e segurança de sistemas através de redundância.

Popularmente, RAID seria dois ou mais discos (por exemplo, HD ou disco rígido) trabalhando simultaneamente para um mesmo fim, por exemplo, citando o exemplo de RAID-1 logo abaixo, serviria como um espelho simples, rápido e confiável entre dois discos, para fazer o backup de um disco em outro.

História

O RAID foi proposto em [[[1988]]] por David A. Patterson, Garth A. Gibson e Randy H. Katz na publicação "Um Caso para Conjuntos de Discos Redundantes Económicos (RAID)". Publicado na Conferência SIGMOD de 1988: pág. 109–116. Foi um trabalho que gerou a indústria dos conjuntos de disco redundantes.

 Vantagens

  1. Ganho de desempenho no acesso.
  2. Redundância em caso de falha em um dos discos.
  3. Uso múltiplo de várias unidades de discos.
  4. Facilidade em recuperação de conteúdo perdido.

 Arquitecturas

 Via software

RAID via software é feita por software, como o kernel do sistema operacional ou usando um aplicativo que gere esta configuração.

 Via hardware

RAID via hardware é feito por um dispositivo que conecta um disco ao outro. Essa conexão é feita por um cabo ou uma placa controladora. O hardware necessário para controlar um RAID necessita de processadores internos especializados para esse fim e de memória cache.

 Comparação entre as arquitecturas

Ao compararmos RAIDs por software e por hardware é possível perceber que os implementados através de software são mais flexíveis que os via hardware. Por outro lado, os primeiros demandam vários ciclos e maior necessidade de capacidade de CPU. Nos RAID´s via hardware, as controladoras executam este tipo de tarefa, elas são desenvolvidas para este fim.

Comparando os dispositivos de blocos, os softwares também são flexíveis podendo ser usados em discos inteiros, partições ou outro dispositivo de bloco. E por hardware, o grupo engloba todas as unidades de disco em um único arranjo.

As vantagens de usar um RAID via hardware são as altas taxas de transferência que a memória cache oferece, uma vez que o acesso e transferências são geridas por hardware, não sendo necessária a intervenção do CPU do sistema.

 Níveis de RAID

Níveis de RAID são as várias maneiras de combinar discos para um fim.

                                                                                                             

O sistema RAID consiste em um conjunto de dois ou mais discos rígidos com dois objectivos básicos: tornar o sistema de disco mais rápido (isto é, acelerar o carregamento de dados do disco), através de uma técnica chamada divisão de dados (data stripping ou RAID 0) e/ou tornar o sistema de disco mais seguro, através de uma técnica chamada espelho (mirroring ou RAID 1). Essas duas técnicas podem ser usadas isoladamente ou em conjunto.

 RAID 0 Linear

É uma simples concatenação de partições para criar uma grande partição virtual. Isto é possível se existirem várias unidades pequenas, com as quais o administrador pode criar uma única e grande partição. Esta concatenação não oferece redundância, e de facto diminui a confiança total: se qualquer um dos discos falhar, a partição combinada falha.

Os dados são subdivididos em segmentos consecutivos (stripes) que são escritos sequencialmente através de cada um dos discos de um array. Cada segmento tem um tamanho definido em blocos. O stripping oferece um melhor desempenho, quando comparado a um disco individual, se o tamanho de cada segmento for ajustado de acordo com a aplicação que utilizará o array.

No caso da aplicação armazenar pequenos registros de dados, então um segmento de tamanho grande é preferencial. Se o tamanho de segmento para um disco é grande o suficiente para conter um registo inteiro, os discos do array podem responder independentemente para as requisições simultâneas de dados. Caso contrário, se a aplicação armazenar grandes registos de dados, os segmentos de pequeno tamanho são os mais apropriados. Se um determinado registo de dados está armazenado em vários discos do array, o conteúdo do registo pode ser lido em paralelo, aumentando o desempenho total do sistema.

Cabe ressaltar alguns pontos negativos desta implementação no que toca a confiança e desempenho. RAID 0 não terá o desempenho desejado com sistemas operacionais que não oferecem suporte de busca combinada de sectores. Os resultados serão correctos porém não haverá paralelismo e nenhum ganho de desempenho. Outra desvantagem desta organização é que a confiança se torna potencialmente pior. Um disco sled com um tempo médio de vida de 20.000 horas será 4 vezes mais seguro do que 4 discos funcionando em paralelo com RAID 0 (Admitindo-se que a capacidade de armazenamento somada dos quatro discos for igual ao do disco SLED). Como não existe redundância, não há muita confiança neste tipo de organização.

 RAID 1

 

RAID 1 é o nível de RAID que implementa o espelho de disco, também conhecido como mirror. Para esta implementação são necessários no mínimo dois discos. O funcionamento deste nível é simples: todos os dados são gravados em dois discos diferentes; se um disco falhar ou for removido, os dados preservados no outro disco permitem a não descontinuidade da operação do sistema.

Apesar de muitas implementações de RAID 1 envolverem dois grupos de dados (daí o termo espelho ou mirror), três ou mais grupos podem ser criados se a alta confiança for desejada. O RAID 1 é o que oferece maior segurança, pois toda informação é guardada simultaneamente em dois ou mais discos. Se ocorrer uma falha num dos discos do array, o sistema pode continuar a trabalhar sem interrupções, utilizando o disco que ficou operacional. Os dados então são reconstruídos num disco de reposição (spare disk) usando dados do(s) disco(s) sobrevivente(s). O processo de reconstrução do espelho tem algum impacto sobre o desempenho de I/O do array, pois todos os dados terão de ser lidos e copiados do(s) disco(s) intacto(s) para o disco de reposição.

Com o RAID 1 consegue-se duplicar o desempenho na leitura de informação, pois as operações de leitura podem ser repartidas pelos dois discos.

RAID 1 oferece alta disponibilidade de dados, porque no mínimo dois grupos completos são armazenados. Conectando os discos primários e os discos espelhados em controladoras separadas, pode-se aumentar a tolerância a falhas pela eliminação da controladora como ponto único de falha. Entre os não-híbridos, este nível tem o maior custo de armazenamento pois estaremos a utilizar dois discos para a mesma informação. Este nível adapta-se melhor em pequenas bases de dados ou sistemas de pequena escala que necessitem de confiança.

RAID 2

Raramente são usados, e em algum momento ficaram obsoletos pelas novas tecnologias de disco. RAID 2 é similar ao RAID 4, mas armazena informação ECC (Error correcting code), que é a informação de controle de erros, no lugar da paridade. Este facto possibilitou uma pequena protecção adicional, visto que todas as unidades de disco mais novas incorporaram ECC internamente. O RAID 2 origina uma maior consistência dos dados se houver queda de energia durante a escrita. Baterias de segurança e um encerramento correcto podem oferecer os mesmos benefícios.

RAID 3

RAID 3 é similar ao RAID 4, excepto pelo facto de que ele usa o menor tamanho possível para o stripe. Como resultado, qualquer pedido de leitura invocará todos os discos, tornando as requisições de sobreposição de I/O difíceis ou impossíveis.

A fim de evitar o atraso em razão da latência rotacional, o RAID 3 exige que todos os eixos das unidades de disco estejam sincronizados. A maioria das unidades de disco mais recentes não possuem a opção de sincronização do eixo, ou se são capazes disto, faltam os conectores necessários, cabos e documentação do fabricante.

RAID 4

Funciona com três ou mais discos iguais. Um dos discos guarda a paridade (uma forma de soma de segurança) da informação contida nos discos. Se algum dos discos avariar, a paridade pode ser imediatamente utilizada para reconstituir o seu conteúdo. Os discos restantes, usados para armazenar dados, são configurados para usarem segmentos suficientemente grandes (tamanho medido em blocos) para acomodar um registo inteiro. Isto permite leituras independentes da informação armazenada, fazendo do RAID 4 um array perfeitamente ajustado para ambientes transaccionais que requerem muitas leituras pequenas e simultâneas.

O RAID 4 assim como outros RAID's, cuja característica é utilizarem paridade, usam um processo de recuperação de dados mais envolvente que arrays espelhados, como RAID 1. Este nível também é útil para criar discos virtuais de grande dimensão, pois consegue somar o espaço total oferecido por todos os discos, excepto o disco de paridade. O desempenho oferecido é razoável nas operações de leitura, pois podem ser utilizados todos os discos em simultâneo.

Sempre que os dados são escritos no array, as informações são lidas do disco de paridade e um novo dado sobre paridade deve ser escrito para o respectivo disco antes da próxima requisição de escrita ser realizada. Por causa dessas duas operações de I/O, o disco de paridade é o factor limitante do desempenho total do array. Devido ao facto do disco requerer somente um disco adicional para protecção de dados, este RAID é mais acessível em termos monetários que a implementação do RAID 1

 

Raid 5

 

RAI

 

O RAID 5 é frequentemente usado e funciona similarmente ao RAID 4, mas supera alguns dos problemas mais comuns sofridos por esse tipo. As informações sobre paridade para os dados do array são distribuídas ao longo de todos os discos do array , ao invés de serem armazenadas num disco dedicado, oferecendo assim mais desempenho que o RAID 4, e, simultaneamente, tolerância a falhas.

Para aumentar o desempenho de leitura de um array RAID 5, o tamanho de cada segmento em que os dados são divididos pode ser optimizado para o array que estiver a ser utilizado. O desempenho geral de um array RAID 5 é equivalente ao de um RAID 4, excepto no caso de leituras sequenciais, que reduzem a eficiência dos algoritmos de leitura por causa da distribuição das informações sobre paridade. A informação sobre paridade ao ser distribuída ao longo de todos os discos, havendo a perda de um, reduz a disponibilidade de ambos os dados e da informação sobre paridade, até à recuperação do disco que falhou. Isto pode causar degradação do desempenho de leitura e de escrita..

 

RAID 1 + 0 (zero)

O RAID 0 + 1 é uma combinação dos níveis 0 (Striping) e 1 (Mirroring), onde os dados são divididos entre os discos para melhorar o rendimento, mas também utilizam outros discos para duplicar as informações. Assim, é possível utilizar o bom rendimento do nível 0 com a redundância do nível 1. No entanto, é necessário pelo menos 4 discos para montar um RAID desse tipo. Tais características fazem do RAID 0 + 1 o mais rápido e seguro, porém o mais caro de ser implantado..

RAID 10

Este modo pode ser usado apenas se tiver 4 discos rígidos. Os dois primeiros funcionarão em Mirroring, dobrando a segurança, enquanto os outros dois funcionarão em stripping, melhorando a performance. Este modo é na verdade uma combinação dos dois primeiros 0 e 1

 

RAID 50

É um arranjo híbrido que usa as técnicas de RAID com paridade em conjunção com a segmentação de dados. Um arranjo RAID-50 é essencialmente um arranjo com as informações segmentadas através de dois ou mais arranjos. Veja o esquema representativo abaixo:

 

                                     RAID 0
            /-----------------------------------------------------\
            |                          |                          |
          RAID 5                     RAID 5                     RAID 5
   /-----------------\        /-----------------\        /-----------------\
   |        |        |        |        |        |        |        |        |
120 GB   120 GB   120 GB   120 GB   120 GB   120 GB   120 GB   120 GB   120 GB
  A1       A2       Ap       A3       A4       Ap       A5       A6       Ap
  B1       Bp       B2       B3       Bp       B4       B5       Bp       B6
  Cp       C1       C2       Cp       C3       C4       Cp       C5       C6
  D1       D2       Dp       D3       D4       Dp       D5       D6       Dp

 

Create a Free Website