В последние годы (2003-2007) тактовая частота новых процессоров оставалась практически практически неизменной (2.4..3.6 ГГц), поскольку разработчики процессоров столкнулись с тем, что при уменьшении размеров элементов процессоров слишком быстро растёт энергопотребление приводящее к проблемам с отводом избыточного тепла. Подход, который ранее обеспечивал неуклонный рост тактовой частоты и, соответственно, производительности, перестал работать. Выход был найден в увеличении количества процессорных ядер в одном корпусе или даже на одном кристале. Быстро стали доступны 2-ядерные и 4-ядерные процессоры, и даже 8-ядерные. Недорогие 2-ядерные процессоры стали основой для массовых персональных компьютеров. Многоядерные процессоры практически эквивалентны компьютерам с несколькими одноядерными процессорами построенным по архитектуре SMP ( Symmetric MultiProcessing). Ранее такая архитектура была доступна только на серверах, а теперь стала обычным явлением для ПК. Однако, узким местом для многоядерного процессора является общая для ядер внешняя шина обмена данными, что для задач, интенсивно использующих память, может иметь существенное значение.
Для успеха Intel на данном этапе процессорной гонки важным стало то, что она располагала альтернативной архитектурой процессоров совместимой по командам с основной линией x86. Эти процессоры применялись с ноутбуках, где их меньшая потребяемая мощность являлась существенным фактором для обеспечения продолжительной работы от батарей. Процессоры для ноутбуков при меньшей тактовой частоте не уступали по производительности моделям для настольных ПК, поскольку, благодаря достоинствам своей архитекуры, выполняли, в среднем, больше операций в расчёте на один такт.
Современные процессоры Intel архитектуры Core (Core 2) соединили в себе достоинства всех своих предшественников и при равной частоте превосходят по производительности процессоры Pentium 4 более, чем вдвое. Увеличение количества процессорных ядер даёт ещё большее преимущество новым процессорам, но при условии, что программное обеспечение способно эффективно загрузить работой более одного ядра.
Вниманию пользователей ЛТФ предлагается новый многопроцессорный (фактически, четырёх-процессорный) сервер 'DXCore' на базе 2 двух-ядерных процессоров Xeon 5160 с тактовой частотой 3 GHz. Сервер обладает 4-канальной подсистемой памяти (в отличии от 2-канальной на ПК) объёмом 16 ГБайт. На 2007-2008 гг это лидер по производительности среди компьютеров ЛТФ.
В компьютере 'DXCore'
установлены два двухядерных процессора Xeon 5160 (Woodcrest)
работающие на частоте 3 GHz, частота системной шины 1.333 GHz.
Каждый процессор оснащен кэш-памятью второго уровня объемом 4 MB.
'DXCore' укомплектован 16 GB оперативной памяти типа
DDR2 ECC 667MHz, двумя SATA дисками Seagate ST3320620AS по 320 GB каждый,
двумя сетевыми адаптерами Gigabit Ethernet.
Основу компьютера 'DXCore'
составляют корпус Industrial MS-3830 высотой 3U, предназначенный для монтажа в
19-ти дюймовую стойку, и системная плата Intel S5000PSLSAS, использующая набор
микросхем Intel i5000P. Сборка компьютера - московской фирмы "Интегральные
технологии".
Дисковая подсистема компьютера програмным образом сконфигурирована так, чтобы обеспечить максимальную скорость чтения/записи (до 140 МБайт/с) на файловых системах /tmp и /data/dxcore (RAID0) и повышенную надёжность на системных разделах (RAID1).
Высокая скорость шины памяти и большая плотность размещения модулей памяти потребовала дополнительного нештатного вентилятора для обдува модулей памяти, в противном случае температура памяти приближалась к порогу неустойчивой работы. Для общей вентиляции корпуса сервера используются два высокоскоростных вентилятора, которые делают данную систему очень шумной.
Компьютер DXCore работает под управлением 64-бит ОС Linux, идентичной операционной системе, установленой на серверах Opteron1/2. На DXCore установлена полностью 64-разрядная версия Linux - Debian 5 (Lenny). Это означает, что все приложения и библиотеки скомпилированны в 64-разрядном варианте. Тем не менее поддерживаются 32-разрядные приложения с помощью ограниченного набора 32-бит библиотек. Также поддерживаются, 32-бит и 64-бит приложения, собранные статически (Reduce, Form, например).
Следует обратить внимание пользователей на то, что в силу фундаментальных различий между процессорами Intex Xeon, AMD Opteron (разновидность Intel-архитектуры), процессорами Alpha и процессорами SPARC (на машинах Sun), транслированные программы в машинных кодах (исполняемые файлы, а так же объектные модули и библиотеки) можно использовать только на том процессоре, для которого они предназначены. Отличить файлы с машинными кодами для разных архитектур можно командой 'file program_file_name'. На приведенном ниже примере видно различие в типах файлов содержащих исполняемый код для команды 'diff' на разных машинах:
theor:> file /usr/bin/diff
/usr/bin/diff: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), for GNU/Linux 2.2.0, dynamically linked (uses shared libs), stripped
opteron1:> file /usr/bin/diff
/usr/bin/diff: ELF 64-bit LSB executable, AMD x86-64, version 1 (SYSV), for GNU/Linux 2.6.0, dynamically linked (uses shared libs), for GNU/Linux 2.6.0, stripped
dxcore:> file /usr/bin/diff
/usr/bin/diff: ELF 64-bit LSB executable, AMD x86-64, version 1 (SYSV), for GNU/Linux 2.6.0, dynamically linked (uses shared libs), for GNU/Linux 2.6.0, stripped
В противоположность программам в машинных кодах, одни и те же файлы с текстовыми сценариями (scripts) для командных процессоров sh, bash, csh, tcsh, как правило, одинаково работают, Solaris, так и под Linux. Это утверждение справедливо и для сценариев языка Perl, а, с некоторыми оговорками, для AWK и MAKE (одинаково ведут себя GNU AWK 'gawk' и GNU MAKE 'gmake').
Название | версия | команда | X11 | документация | комментарий |
Компиляторы с языков высокого уровня, средства разработки | |||||
Intel Fortran 77, 90, 95 | 12.0 | ifort | ifort -help, HTML | рекоменуемая оптимизация '-fast' | |
Intel Fortran 77, 90, 95 | 10.0 | ifort10 | ifort10 -help, HTML - use MS IExplorer to read | рекоменуемая оптимизация '-fast' | |
Intel C/C++ | 12.0 | icc | icc -help, HTML | рекоменуемая оптимизация '-fast' | |
Intel C++ | 12.0 | icpc | icpc -help | ||
Intel Debugger | 26 | idb | idb -help | Intel Debugger Manual | |
GNU Fortran 77 | 4.4.5 |
gfortarn | о компиляторах GNU | ||
GNU C | 4.4.5 |
gcc | man gcc,
info gcc HTML |
рекомендуемая оптимизация '-O3 -mtune=core2', о компиляторах GNU |
|
GNU C++ | 4.4.5 |
g++ | man g++,
info g++ HTML |
о компиляторах GNU | |
GNU Debugger | 7.0.1 | gdb | man gdb, info gdb | ||
Системы аналитических и численных вычислений | |||||
Reduce | Free CSL | reduce xreduce |
- + |
info
redref PDF, PS |
о Reduce |
Form |
3.2 | form | - | текст лицензии, ещё о Form 3 | |
Octave |
2.1.73 | octave | - | HTML | |
Maxima |
5.21 | maxima | - | HTML | |
Браузеры, FTP, e-mail и т. п. | |||||
NcFTP | 3.2.4 | ncftp | - | HTML | FTP клиент для текстового режима |
Iceape |
2.0.11 |
iceape |
+ | man iceape | браузер |
Редакторы текстов | |||||
Emacs | 23.2 | emacs | +/- | man
emacs info emacs |
|
Visual Editor IMproved | 7.2 | gvim vim |
+ - |
man vim | |
Системы подготовки и просмотра документов | |||||
Ghost Script | 8.71 | gs | + | man gs | работа с PostScript файлами |
DjVu viewer | 3.5.23 | djview | + | man djview | просмотр DJVU файлов |
Графические средства | |||||
GNU Image Manipulation Program | 2.6.10 |
gimp | + | man gimp | |
Grace | 5.1 | grace xmgrace |
+ | HTML | |
X Fig | 3.2 | xfig | + | man xfig | |
GNU plot | 4.4 | gnuplot | +/- | man gnuplot | |
Файл-менеджеры | |||||
Midnight Commander | 4.7 | mc | - | man mc, HTML | со встроенным FTP клиентом |
"+" в колонке "X11" показывает необходимость системы X-Window для работы программы,
"+/-" означает, что программа может работать, как в системе X-Window, так и в текстовом режиме.
Fortran Процессор Xeon 5160 обеспечивает очень высокую производительность для тех, кому необходимы вычисления с плавающей точкой. Для пользователей, желающих программировать на Fortran, естественно использовать компилятор от компании Intel. Компилятор поддерживает стандарты Fortran-77, -90, -95. Вызывается компилятор командой 'ifort' (Intel Fortran). Рекомендуется использовать опцию оптимизации '-fast'. Краткую справку по опциям командной строки можно получить по команде 'ifort -help'.Документацию по Intel Fortran можно найти на Web-страницах: "Intel(R) Fortran Compiler Documentation", "Intel(R) Fortran Compiler for Linux - Top Technical Issues", Intel(R) Fortran Compiler for Linux Product Manuals.
GNU компиляторы С(gcc) и С++ (g++) Для достижения максимальной производительности программ рекомендуется при компиляции, кроме общих флагов оптимизации (-O2 или -O3, например), использовать флаг '-mtune=core2', указывающий на конкретную архитектуру процессора.
Form v. 3.1 Версия Form скомпиллирована для 64-разрядной архитектуры AMD x86-64 и превосходит по скорости 32-бит версию. В процессе работы Form интенсивно использует чтение-запись во временные файлы, поэтому, чтобы не замедлять работу программы и не перегружать сеть, следует либо запускать Form на 'DXCore' на локальном диске в подкаталогах каталога /data/dxcore, либо задавать каталог для временных файлов /tmp с помощью ключа '-t /tmp' или в файле установок, например, form.set с помощью строки 'tempdir /tmp'. На файл установок указывает переменная FORMSETUP. Задать свой файл установок можно либо задавая значение этой переменной командой 'setenv FORMSETUP form.set', либо указывая имя файла в командной строке после ключа '-s'. Для преобразования программ из старой версии 2 в формат версии 3 можно воспользоваться утилитой 'conv2to3'.
Reduce (Free CSL version), 06-Feb-12 Reduce на DXCore - 64-разрядный,
способен адресовать более 4 GB памяти (для 32-бит Reduce предел - 128 MB).
Если есть необходимость, то 32-разрядный вариант Reduce 3.8 можно
запустить командой 'reduce32bit'. DXCore можно рекомедовать,
как самую быструю, из установленных в ЛТФ, вычислительную систему
для расчётов на Reduce.
Тест, компилятор / Компьютер, процессор |
DXCore Xeon 5160 3 GHz |
Opteron1 Opteron 248 2.2 GHz |
Unamp AthlonMP 2800+ 2.1 GHz |
Theor Pentium 4 Xeon 3.2 GHz |
Up4m Pentium 4 Xeon 2.2 GHz |
Thsun5 Ultra SPARC 750 MHz |
PC-2007 AMD Athlon64 2.4 GHz |
PC-2007 Core 2 E6750 2.66 GHz |
PC-2008 Core 2 E8400 3 GHz |
Whetstone, Fortran, millions | 11810 2) | 7634 2) | 4000 3) | 3220 | 2300 | 470 | 9350 | 9250 | 13600 |
Linpack 1000x1000 matrix, Fortran, MFlops | 900 2) | 363 2) | 118 3) | 235 | 300 | 153 | 240? | 916 | 1311 |
Linpack 200x200 matrix, C 1), MFlops | 1700 | 1000 |
980 | 1050 | 850 |
167 | 1400 | 1800 | 2020 |
Linpack 4000x4000 matrix, C1), MFlops | 585 | 356 | 114 | 220 | 210 | 58 | 420 | 560 | 630 |
Fast Fourier Transform 106 points, Fortran, sec | 0.33 2) | 0.62 2) | 2.0 3) | 1.5 | 1.5 | 3.2 | 0.76 | 0.4 | 0.29 |
Fast Fourier Transform 20011 points, Fortran, sec | 0.56 2) | 1.5 2) | 5.2 3) | 1.7 | 3 | 9.4 | 3.4 | 0.9 | 0.69 |
Fast Fourier Transform 106 points, C++, sec | 0.36 4) | 0.61 | 2.1 | 1.2 | 1.57 | 3.7 | ? | 0.4 | 0.34 |
Fast Fourier Transform 20011 points, C++, sec | 0.56 4) | 1.7 | 5.6 | 1.6 | 3.6 | 9.3 | 4.4 | 0.8 | 0.54 |
int(1/(sin(x)^31*cos(x)^47),x)$, Reduce 3.7, sec | 0.94 | 1.22 | 1.34 | 1.8 | 2.5 | 6.1 | ? | 0.87 | 0.73 |
Integrate[1/(Sin[x]^31*Cos[x]^47),x], Mathematica 5), sec |
0.14 | 0.26 | 0.52 | 0.47 | 0.66 | 2.4 | ? | ? | 0.17 |
f=(a+b+c+d)^50, Form 3, sec | 0.14 | 0.26 | 0.43 | 0.35 | 0.51 | 1.5 | 0.3 | 0.22 | 0.21 |
1) См. полный график результатов теста LinpackБолее новые и более производительные серверы: THEOR2, i7K и i7X, i7A и i7B
2) Intel Fortran ver. 10 для 64-bit Linux x86-64
3) Intel Fortran для 32-bit Linux/x86 ver. 5 (опции -O2 -tpp6)
4) g++ -O3 -mtune=nocona
5) Mathematica 5.2 64-bit на DXCore и Opteron1/2 и Mathematica 4 32-bit на остальных компьютерахТесты на Fortran, C и C++ проводились для вычислений с двойной точностью.
Все пользователи, зарегистрированные на Unix кластере ЛТФ, автоматически получают доступ к компьютеру DXCore. Для входа на DXCore можно воспользоваться telnet (в пределах сети ЛТФ) или ssh (в пределах сети ОИЯИ). С любой машины Unix кластера ЛТФ можно войти на DXCore набрав команду 'rlogin dxcore', пароль в этом случае не требуется. Если вы используете систему X-Window, то вместо 'rlogin' рекомендуется пользоваться командой 'xon dxcore', при этом запустится программа 'xterm', которая создаст новое окно, в котором будет открыта интерактивная сессия на компьютере DXCore. Домашние директории пользователей на DXCore те же, что для всего кластера ЛТФ.
Для работы на DXCore с программами интенсивно использующими ввод/вывод данных из файлов выделено пространство на локальном диске в директории /data/dxcore/users. Этот диск доступен также на других серверах ЛТФ в директории с тем же именем. Хранение в '/data/dxcore/users' данных, не связанных непосредственно с вычислениями не допускается.
Компьютерная группа ЛТФ
6 декабря 2007 г.
e-mail: super@theor.jinr.ru, telepuzik@theor.jinr.ru e-mail yoda@theor.jinr.ru, godzilla@theor.jinr.ruДата обновления: 2014-04-10 17:47:13
Вверх Главная страница описания Главная страница ЛТФ