Página Inicial



twitter

Facebook

  Notícia
|

 

ENTENDA A DIVISÃO DE MEMÓRIAS DA GEFORCE GTX 970 E O MOTIVO QUE LEVOU A NVIDIA A FAZER ISSO

29/01/2015

Sem a menor sombra de dúvidas, o assunto mais comentado do momento no mundo do hardware é o uso de memória da Nvidia GeForce GTX 970, GPU lançada em setembro do ano passado. De acordo com usuários de uma série de fóruns, incluindo o OverClock.net, a placa de vídeo estaria usando 3.5 GB de Vram em situações onde a GTX 980 usava todos os seus 4 GB.

Após isso, um benchmark específico, chamado Nai Benchmark, mostrou que a placa de vídeo de fato possui 4 GB de Vram. Porém, 0.5 GB desse total apareciam como mais lentos do que o resto. Nós publicamos uma extensa notícia sobre o assunto ontem, que é recomendada como ponto de partida para este artigo.

A notícia inclui declarações da Nvidia, mas não traz informações tão técnicas e profundas quanto as que estão disponíveis hoje. Isso porque o pessoal do PC Perspective falou com o vice-presidente sênior de engenharia de GPUs da Nvidia, Jonah Alben. E ele deu explicações bem... complexas, como era de se esperar.

Para informações mais resumidas, não esqueça de ler a conclusão

Para começar, é necessário notar que as GeForce GTX 970 e 980 são baseadas no mesmo chip, o GM204. Mesmo assim, elas possuem configurações diferentes: a GTX 980 traz todas as unidades de processamento gráfico ativadas. Na GTX 970, 3 dos 16 multiprocessadores shader (SMs) estão desabilitados. Desde a série 6000, com as 6800 GT e 6800 GS, isso é algo que a Nvidia (e a AMD também) faz. Isso é feito porque nem todo chip sai da fábrica perfeito, o que leva as fabricantes a desabilitarem partes defeituosas da produção e criar placas de vídeo mais baratas utilizando apenas os SMs que funcionam. Como as arquiteturas das GPUs trabalham de maneira paralela, é possível criar produtos confiáveis e mais acessíveis a partir disso.

A GTX 970 tem parte do chip desabilitado, comparado a GTX 980. Nvidia e AMD fazem isto com seus chips gráficos, desativando partes defeituosas e mantendo apenas as funcionais, criando assim os modelos de diferentes segmentos de performance

Mas essa prática, utilizada há tanto tempo, definitivamente não é a responsável pelo uso incomum de memória da GTX 970. O que realmente acontece é explicado pelo diagrama acima, que mostra os 13 SMs habilitados (e os 3 desabilitados), cada um com 128 CUDA Cores, resultando no já conhecido total de 1664. Mas isso não é novidade. O que realmente importa aqui é a memória do sistema, que se conecta aos SMs através do barramento da memória de vídeo. Esse barramento inclui 8 portas para se conectar com uma série de memórias Cache L2 e controladores de memória. Na GTX 980, absolutamente todos eles são utilizados.

Na GTX 970, porém, apenas 7 dessas portas foram habilitadas, o que significa que 1 memória L2 Cache e algumas unidades de saída de renderização (ROPs) foram desabilitadas. Mesmo assim, o segmento do controlador de memória de 32-bits segue por ali. Mais do que isso: o segmento de Vram de 512 MB que estava ligado a essa L2 Cache também está por ali. E é exatamente esse segmento de Vram que representa os 0.5 GB do qual certos usuários estavam reclamando.

Na GTX 970, uma das oito portas L2 Cache está desabilitada. E é aí que estão os 0.5GB mais lentos

Isso só foi possível por causa de um novo recurso da arquitetura Maxwell. Ele permite desabilitar parte da Cache L2 e das unidades ROPs e então utilizar uma interface que continua alimentando e se comunicando com o controlador desse segmento de memória. Com isso, os SMs usam apenas uma interface L2 para se comunicar com os 2 segmentos de DRAM que estão do lado direito do diagrama.

Para que isso funcione, a Nvidia precisou mudar algumas coisas no funcionamento da placa de vídeo. Se nada fosse alterado, a 7ª porta do barramento da memória de vídeo teria o dobro da carga das outras portas, já que ela está ligada 2 segmentos de memória. Enquanto, todas as outras 6 portas teriam metade dessa carga, o que causaria numa redução da largura de banda, fazendo com que a GPU ficasse bem menos eficiente.

Com o objetivo de evitar isso, a Nvidia dividiu a memória em 2 grandes segmentos diferentes. O primeiro tem 3.5 GB e inclui 7 das 8 DRAMs. No outro segmento está o 0.5 GB restante. Logicamente, o primeiro segmento tem prioridade, e todas as DRAMs possuem taxas de requisição iguais, o que faz com que a largura de banda fique equilibrada e possa, assim, ser maximizada. Como a imensa maioria dos games atuais usam bem menos do que 3.5 GB de Vram, essa configuração faz todo o sentido.

A Nvidia dividiu a memória de forma a usar primeiro os 3.5GB mais eficientes

Mas as coisas ficam realmente interessantes quando a placa precisa de mais de 3.5 GB. Para começar, é interessante notar que, se rodasse sozinho, o segmento de 0.5 GB teria desempenho 7 vezes pior que o do resto da memória. Só que, na prática, isso não acontece. A explicação para isso está na maneira como a memória é alocada pelo sistema operacional quando o computador está rodando games ou programas em geral. Conforme a memória é requisitada por um determinado aplicativo, o sistema vai alocar parte disso com base numa série de fatores. Isso inclui a quantidade de espaço na Vram que o game pediu, o quanto o sistema operacional tem disponível e o padrão de uso dos softwares.


Portanto, se um jogo alocou 3 GB de memória gráfica, ele pode usar apenas 500 MB regularmente, enquanto o resto fica apenas para usos mais esporádicos. Dados como texturas comprimidas, que ocupam menor largura de banda, podem ser movidos para outros segmentos de memória sem muito custo de desempenho. Com a GTX 970, o sistema operacional tem 3 segmentos de memória para utilizar. Afinal, além das partes de 3.5 GB e 0.5 GB, ainda tem a memória do sistema que pode ser acessada através do PCI Express. E esse 0.5 GB, quando são necessários, ainda são 4 vezes mais rápidos do que a memória do sistema, tornando-se uma saída útil e bem viável.

Mesmo com as ressalvas da própria Nvidia, afirmando que esta alocação menos ágil em 0.5GB de memória da placa não traz um grande impacto na performance, já surgiram indícios que a empresa está trabalhando em um update para melhorar o desempenho e a alocação deste segmento da memória da GTX 970, muito possivelmente por conta do reflexo negativo que toda a história causou. 

O problema maior é outro: houve um erro no marketing, e a placa foi divulgada como possuindo 64 ROPs e 2048 KB L2 cache, quando na verdade possui 56 e 1792 KB

Só que tem uma outra questão, um pouco mais complicada para a Nvidia. As especificações da GTX 970 que foram divulgadas inicialmente estavam erradas. Isso significa que a placa não tem 64 ROPs e 2048 KB de Cache L2, como foi dito inicialmente, mas sim 56 ROPs e 1792 KB de Cache L2. Mas é bom notar que essa diferença de ROPs não chega a causar gargalos, já que os 13 SMs da GTX 970 conseguem gerar 52 pixels/clock. Com seus 56 ROPs, a placa de vídeo consegue gerar 56 pixels/clock. Segundo a empresa, isso foi resultado de um erro de comunicação entre a equipe de engenharia e a equipe de marketing. 

Conclusão

Afinal de contas, agora que já passamos por uma gigantesca quantidade de dados técnicos, que diferença isso tudo faz no mundo real, nos games que jogamos? Para começar, são raríssimos os jogos que, hoje em dia, usam mais do que 3.5 GB de memória. Portanto, na imensa maioria dos títulos, essa questão não faz a menor diferença. Isso nós comprovamos nos benchmarks das 2 análises de GTX 970 que já publicamos: Gigabyte GTX 970 G1 Gaming e MSI GeForce GTX 970 Gaming 4G

Mesmo assim, há raros exemplos, como Shadow of Mordor, que ousam romper a barreira dos 3.5 GB. Nestes jogos, verifica-se uma diferença de desempenho, mas apenas em situações onde se usa mais de 3.5 GB e menos de 4 GB de Vram. Nessas ocasiões, a GTX 970 tem perda de desempenho de 4% a 6% no acesso global da memória – ou seja, não estamos nem falando na diminuição do desempenho geral da placa de vídeo, que, no caso, seria ainda mais branda. Basicamente, é difícil encontrar situações onde esse pedaço mais lento de memória faz a diferença. E, mesmo nesses cenários, a perda de performance é mínima.

 

No final das contas, talvez tenha sido essa inusitada configuração que tornou possível a GTX 970 ser uma placa de altíssimo desempenho que mesmo assim pode ser encontrada por R$ 1,4 mil em várias lojas. Só é uma pena que a Nvidia não tenha divulgado essas informações antes, afinal ter deixado o público descobrir "por conta" que parte da VRAM não é tão eficiente "queimou" a imagem da empresa.

E vocês, o que acham? O marketing deveria ter sido diferente por parte da companhia? Essa confusão toda mudou sua opinião sobre a placa? Não esqueça de comentar!
 
 
Fonte: Adrenaline

 
Indique esta notícia Indique esta notícia para um amigo

Início Notícias  | Voltar