( Начало ковыряний ) Не хватает у меня

(Начало ковыряний)
[Все сказанное верно, как минимум, для моих условий, то есть для тех двух платформ, на которых все это делается - GA-8IE533 и ECS 945PL-A]

Не хватает у меня мозгов, чтоб получить цельную картину работы памяти из теоретических сведений, поэтому так и исследую методом тыка, а потом строю свои теории :)

Забавный факт выяснился в работе, нумерации и чередовании банков (физических, на уровне которых работает логика матери). Если у DDR все более-менее логично (кроме разве что их нумерации в SPD, и то вроде бы не на всех платформах) - то есть сначала работает 1й банк (сторона, на которой живет EEPROM), потом второй. Подтверждение - если вычисляем, что ошибка приходится на вторую половину модуля (тупо, по показаным метрам в мемтесте, например), отключением второго банка оживляем модуль за счет половины объема. У DDR2 (DDR3 пока не ковырял) оказалось гораздо забавнее - оказалось, что сначала работает физически второй банк, после него - первый. Пример: гоняю модуль DDR2 на 1Гб двухбанковый, двухсторонний. Получаю ошибку на 686.2Мб. Отключаю 2й банк и получаю ошибку на 174.2Мб, то есть менше на 512Мб, далее путем не хитрых вычислений (правда со 2го раза, но об этом позже) вычислил сбойную микросхему (которая оказалсь на лицевой стороне) и получил рабочий модуль в полном объеме. То есть получается, что сначала работает банк с четным номером, далее с не четным (такой вывод напрашивается из нумерации банков для DDR, хотя куда там девается последний банк под номером "1" в таком случае не понятно (их какбэ 3), хотя может быть это просто особенность работы конкретных платформ, так что здесь сильно не пинайте). Причем отключение в таком случае 2го банка модуля отключает именно микросхемы на второй стороне. Подтверждение - если снять все со 2й стороны - уполовиненый модуль нормально работает.

Теперь насчет поиска дохлых микросхем. Просто предположил, что одномоментно в микросхеме может задействоватьтся только один логический банк (их 4 в независимости от разрядности и емкости, больше или меньше я пока не встречал), размер одного логического банка получается в 4 раза меньший,чем всей микросхемы. Микросхемы в одном физическом банке работают параллельно, то есть получается такая картина - массив в 4 стоки и, например (для 8ми битных микросхем) 8 столбцов. Каждя ячейка в этом массиве равна объему одного логического банка одной микросхемы. Предположительно, читаются они построчно (в таком массиве) и слева на право. В общем для описанного уже 1Гб модуля DDR2 именно по такому принципу и вычислил дохлую микросхему (первая попытка была по другому принципу и он не подтвердился). Следующий модуль был вылечен с первой попытки причем без отключения банков - какбэ ради подтверждения сразу 2х предположений. Для примера: на этом же 1Гб модуле дохлой оказалась 3я микросхема на лицевой стороне, на 2Гб DDR2 с ошибкой на 498.6Мб под замену пошла последняя микросхема с обратной стороны. Верно опять же (если действительно верно) для моих условий.
Хотя в этой партии был один модуль OCZ с какой-то фантомной ошибкой - по этой логике были заменены все возможние микросхемы (в разных конфигурациях ошибка приходилась как будто на разные места). В итоге он меня достал и остался нормально работать с уполовиненым объемом.

Однако для обычной DDR такая логика не прокатывает. Либо разводка своя, либо платформа не способствует. Например, замены 8й микросхемы для однобанкового 8ми микросхемного модуля оказывается достаточно, хотя должны были быть сбойными 2я, 3я и 8я микросхемы (благо с этим моулем сразу начл с 8й микросхемы). Или по расчетам получается 4я микросхема, а на деле - 2я. Так что пока поиск сбитой мелочи, отзвонка линий и перебор микросхем. Хотя встечался в этой ветке менее трудозатратный способ по вычислению нездоровых с точностью до 2х микросхем.

Не исключено что мне просто повезло (с DDR2), все же маловато статистики.

Зы. Встречал сообщение, что встречаются модули, которые тормозят POST, но при этом отзвонка ничего не дает и ничего не греется. Было и такое (один такой модуль был в моих прошлогодних "отчетах") - в таком случае только перебор. Просто когда использовал микросхемы, снятые со второй стороны тупившего модуля-донора, на ремонтируемой планке получил такой же вис. Заменил впаяную микросхему другой с того же донора - норм.

[Добавлено]
Придумал пару вариантов массивов для DDR, исходя из того что она бывает двухбанковая, но односторонняя, но их надо проверять.

Обидно будет если я загоняюсь

Продолжение следует (надеюсь)...

Ремонт модулей памяти DDR и SDR SDRAM (часть 2)