Página Inicial



twitter

Facebook

  Notícia
|

 

ENTENDA O FUNCIONAMENTO DAS MEMÓRIAS HBM DA AMD

28/05/2015



Quando se trata do aumento do potencial das placas de vídeo, existe um debate sobre a relação entre tamanho do hardware e desempenho. Levantado desde 1965 com a Lei de Moore, a previsão era de que os componentes iriam dobrar em densidade a cada ano, sugerindo como solução a construção de grandes sistemas à partir de funções menores e interconectadas. 

Um dos maiores desafios nas GPUs de hoje envolve o padrão de memória GDDR5, cuja disposição é um dos responsáveis pelo tamanho das placas atuais. Como forma de solucionar essa questão, surgiu um novo padrão de memória que promete mudar essa dinâmica de tamanho, possibilitando a criação de designs mais eficientes e menores: o padrão High Bandwidth Memory (Memória de Alto Barramento, ou HBM).

Entendendo o problema das memórias

O desenvolvimento atual dos módulos de memória nos levaram até a GDDR5, presente em praticamente todas as GPUs atuais voltadas para jogos, consoles e computação de alta performance. Esta estrutura permite que placas de vídeo contenham módulos rodando em até 7GB/s, impactando diretamente no processamento gráfico de games e softwares visuais. Por estas razões, tanto a AMD quanto a Nvidia utilizam este formato de RAM em seus produtos.
 
 
Exemplo de módulo de memória GDDR de 7GB da Hynix

Entretanto, aumentar o desempenho dos módulos de memória torna proporcionalmente mais complicada a estrutura das placas de vídeo. Para oferecer mais desempenho, as GPUs estão acrescentando quantidades maiores de chips, aumentando também seu espaço no PCB e, por fim, exigindo traços mais complexos entre a memória e os reguladores de voltagem. Esse atributo gera consequências negativas para os desenvolvedores de placas gráficas.

Como solução meio-termo, as empresas escolheram caminhos diferentes. Em placas como a Radeon R9 290X, por exemplo, a AMD optou por utilizar um barramento maior em sua memória, de 512-bit, enviando mais dados sem exigir mais espaço físico (PHYs) para os módulos – à custo de uma frequência máxima menor. Já em placas como a GeForce GTX 980, o barramento acaba sendo menor, de 384-bit, para permitir uma frequência maior, porém pode gerar gargalos para as tarefas das memórias.

Outro efeito colateral está no inevitável aumento do consumo de energia das GPUs com GDDR5. Em desempenho máximo, esses módulos de memória podem consumir até 40W, o que representa uma parcela considerável já que muitas placas operam em TDPs de 250W, por exemplo.

 

Isso gera o dilema deste padrão – aumentar o desempenho da memória automaticamente resulta em um TDP maior. As técnicas de arquitetura para a distribuição de banda atuais não conseguem poupar o suficiente sem escalar no consumo de energia e assim, a tendência que se cria é de placas mais potentes, porém maiores e menos econômicas.

O desenvolvimento

Para resolver o problema da complexidade de estrutura de comunicação entre os módulos e o processador da GPU, a AMD entrou em contato com empresas para desenvolver um novo padrão de chip de memória para suas futuras placas gráficas. O objetivo principal envolvia a redução do consumo de energia juntamente com um barramento maior e mais próximo das RAMs. A solução desenvolvida foi batizada de padrão High Bandwitch Memory (HBM).

Desenvolvido em parceria com a Hynix, o padrão HBM foi registrado e adotado pela Joint Electron Device Engineering Council (JEDEC), órgão regulamentador de tecnologias, em outubro de 2013. A empresa é especializada em padrões abertos, e o registro deste novo formato (sob a especificação JESD235) permitirá que todas as empresas utilizem o padrão sem custos de direito autoral, significando um avanço para o setor gráfico e computacional.

O principal diferencial está na criação de um recurso crucial para a aproximação das RAMs – o interpositor.

 

Interpositor permitirá que memórias fiquem mais próximas dos núcleos de processamento das placas de vídeo

A AMD juntou forças com as companhias ASE, Amkor e UMC para criar o interpositor, uma camada de silício que aproxima os módulos de memória – que passam a ficar empilhados – e a matriz lógica da placa. Como vantagem, a comunicação entre a GPU e a memória ocorre mais rápida, já que o espaço entre elas é menor. Isso também impacta no "clocking" das memórias, já que com uma distância menor, a frequência na comunicação se torna muito superior. A disposição desses elementos também facilita a transmissão de dados em barramentos maiores, graças a uma distância física reduzida entre os dois componentes.

Diferenças entre HBM e GDDR5

 

Ilustração demonstrativa do uso do interpositor e do empilhamento das memórias HBM

Além da vantagem de ter uma comunicação facilitada através do interpositor, os módulos de memória HBM são empilhados verticalmente, e trazem "through-silicon vias" (TSVs) e “μbumps” que realizam a conexão entre si. Dessa forma, o espaço é melhor aproveitado.

 

Um exemplo simples está na diferença de tamanho entre o novo padrão e a GDDR5: 1GB em GDDR5 (composta de quatro chips de 256MB) necessitam, no mínimo, de 672mm², enquanto a mesma capacidade está presente em apenas 35mm² numa memória HBM. Esse total representa uma economia de espaço em 94%, facilitando a construção de designs menores em GPUs.

 

Comparativo de DRAM dos padrões GDDR5 e HBM

Outra diferença está na necessidade do tamanho do barramento da memória. Um chip HBM possui largura de 1024-bit, enquanto uma GDDR5 tem apenas 32-bit. Como resultado, estes módulos necessitam de velocidade de clocking menor para transmitir dados, afinal "levam muito mais a cada ciclo". A arquitetura de empilhamento vertical, em conjunto a uma capacidade maior de transferência resulta em uma largura de banda de mais de 100GB/s por conjunto – uma vantagem em comparação aos 28GB/s máximos por chip da GDDR5.

Por conter uma estrutura mais simplificada, os módulos HBM necessitam de voltagem menor e, portanto, consomem menos energia. Com um aproveitamento final até 3x maior que a performance por watt do GDDR5, O resultado final é uma memória mais eficiente, podendo operar em clocks menores, combinando barramentos maiores e transmissão de informações muito mais rapidamente.

A chegada ao mercado

Segundo a Hynix, a primeira geração de memórias HBM empilhará quatro módulos com 256MB cada, chegando a 1GB por conjunto. Como o padrão suporta quatro conjuntos, os primeiros produtos terão 4GB de memória HBM – e a sua primeira aplicação é esperada em alguma GPU da próxima série de placas gráficas da AMD.

O representante técnico da AMD e vice-presidente da JEDEC, Joe Macri, afirmou que a placa contará com 4GB de memória, ao invés das expansões de 8 ou 12GB das GPUs concorrentes. Macri acredita que a capacidade de memória dos topo-de-linha de hoje seja suficiente para a indústria de games atuais, que não se otimiza para um uso adequado de memória. As próximas gerações de GPUs contarão com HBMs de maior capacidade.

 
 
Fonte: Adrenaline

 
Indique esta notícia Indique esta notícia para um amigo

Início Notícias  | Voltar