Тем более на ПЛИС-е
Испытав прототип аппаратного компилятора, созданного на FPGA-матрице, компания NEC докладывает, что по эффективности результата, его трехминутная работа оказалась выше четырехмесячного труда отдельно взятого программиста.
заходишь в магазин и говоришь : мне пожалуйста два 4х процессорных компилятора и один 2х процессорный
а программистов в отпуск :twisted:
Ну, как алгоритмически - это их ноу-хау как раз . Сие сложно, но наработки в этой области есть же. Тот же Интеловский компилер под HT оптимизит же. И под двухъядерность обещают, насколько я помню...
Цитата:
The company said that it uses an "automatic parallelizing compiler" that uses profile information of software to "exploit parallelization patterns."
Паттерны вот какие-то. Предположу - есть образцы кусков однопроцового кода, и соотв. им куски параллельного. Т.е. видят кусок кода, коррелирующий с паттерном и лепят вместо него соотв. кусок параллельного. Это, конечно, весьма упрощенно, но думать дальше лень.
А аппаратно - а чем на ПЛИСЕ нехорошо? Загоняешь туда код, на выходе - другой код. ПЛИСы нынче практически сколь угодно сложные. Памяти к ней приделать кусок тоже не проблема. Вот интересно - они на каком этапе оптимизят - уже машинный код или на ЯВУ.
BTW, в дополнение к своим вопросам добавлю еще и одно соображение - если это _действительно_ правда, то можно ожидать в ближайшем будущем изменение привычной конфигурации схем системной логики...
PS: И еще одна мысль возникла чуть позже - представьте себе связку четырехядерного камня (по четыре шины гипертранспорта на ядро в конфиге "тетраэдра") + сабжевый девайс, если оный действительно работает, это ж какой прорыв в производительности может быть!..
не нравится мне слово "спекулятивный", а то вдруг окажется, что используются паттерны в стиле
Ну, не думаю, что в NEC пионэры сидят.
Цитата:
ближайшем будущем изменение привычной конфигурации схем системной логики...
А вот тут моя мысля - ведь все "многопроцессорные" ширпотребные чипсеты держат (насколько я в курсе) всего 2 проца. Остальное - эксклюзив, причем не Интеловый (могу ошибаться). Для чего и многоядерность лепят - чтоб чипсет видел ОДИН проц, а сам проц у себя внутри с ядрами разбирался...
PS: И еще одна мысль возникла чуть позже - представьте себе связку четырехядерного камня (по четыре шины гипертранспорта на ядро в конфиге "тетраэдра") + сабжевый девайс, если оный действительно работает, это ж какой прорыв в производительности может быть!..
Мысль неплоха, только ПЛИС придётся работать как минимум на частоте HyperTransport , а это недешёвая игрушка.
Как вариант юзать её опционально, как сопрцессор :twisted: ,
и выбираешь: либо твой отдел прикладного программирования будет код оптимизировать, либо ты покупаешь девайс, и вставляешь в соотв. слот-сокет а отдел идёт курить :oops:
overclockers.ru/hardnews/20912.shtml - вид сбоку
tgdaily.com/2005/12/19/nec_multicore_processors/ - первоисточник
Аццкий ромбовод {:€
Я пока не волшебник - я только учусь! :-P
Root
Это все тоже читал, только вот все написанное ни фига не объясняет - приходится гадать, как именно они организовали оное спекулятивное действо...
- Ситчик веселенький есть?..
- Приезжайте, обхохочетесь!..
Тем более на ПЛИС-е
Испытав прототип аппаратного компилятора, созданного на FPGA-матрице, компания NEC докладывает, что по эффективности результата, его трехминутная работа оказалась выше четырехмесячного труда отдельно взятого программиста.
заходишь в магазин и говоришь : мне пожалуйста два 4х процессорных компилятора и один 2х процессорный
а программистов в отпуск :twisted:
Либо нечему гореть, либо нечем поджечь!
Фэйк?
Выход обычно есть. Но он не работает.
Ну, как алгоритмически - это их ноу-хау как раз . Сие сложно, но наработки в этой области есть же. Тот же Интеловский компилер под HT оптимизит же. И под двухъядерность обещают, насколько я помню...
Паттерны вот какие-то. Предположу - есть образцы кусков однопроцового кода, и соотв. им куски параллельного. Т.е. видят кусок кода, коррелирующий с паттерном и лепят вместо него соотв. кусок параллельного. Это, конечно, весьма упрощенно, но думать дальше лень.
А аппаратно - а чем на ПЛИСЕ нехорошо? Загоняешь туда код, на выходе - другой код. ПЛИСы нынче практически сколь угодно сложные. Памяти к ней приделать кусок тоже не проблема. Вот интересно - они на каком этапе оптимизят - уже машинный код или на ЯВУ.
А кому счас легко...
не нравится мне слово "спекулятивный", а то вдруг окажется, что используютяс паттерны в стиле
БЫЛО:
СТАЛО:
Аццкий ромбовод {:€
Я пока не волшебник - я только учусь! :-P
BTW, в дополнение к своим вопросам добавлю еще и одно соображение - если это _действительно_ правда, то можно ожидать в ближайшем будущем изменение привычной конфигурации схем системной логики...
PS: И еще одна мысль возникла чуть позже - представьте себе связку четырехядерного камня (по четыре шины гипертранспорта на ядро в конфиге "тетраэдра") + сабжевый девайс, если оный действительно работает, это ж какой прорыв в производительности может быть!..
- Ситчик веселенький есть?..
- Приезжайте, обхохочетесь!..
Ну, не думаю, что в NEC пионэры сидят.
А вот тут моя мысля - ведь все "многопроцессорные" ширпотребные чипсеты держат (насколько я в курсе) всего 2 проца. Остальное - эксклюзив, причем не Интеловый (могу ошибаться). Для чего и многоядерность лепят - чтоб чипсет видел ОДИН проц, а сам проц у себя внутри с ядрами разбирался...
А кому счас легко...
Мысль неплоха, только ПЛИС придётся работать как минимум на частоте HyperTransport , а это недешёвая игрушка.
Как вариант юзать её опционально, как сопрцессор :twisted: ,
и выбираешь: либо твой отдел прикладного программирования будет код оптимизировать, либо ты покупаешь девайс, и вставляешь в соотв. слот-сокет а отдел идёт курить :oops:
Либо нечему гореть, либо нечем поджечь!
Отправить комментарий