Тъй като този тип изчислителна техника не е позната на широката общественост, направих си труда да преведа статия от уикипедия за историята на транспютъра.
Български транспютър може да видите в каталога тук.
Начало на цитата:
"Транспютърът е серия от пионерски микропроцесори от 80-те години на миналия век, предназначени за паралелни изчисления. За да поддържа тази функция, всеки транспютър има собствена интегрирана памет и серийни комуникационни връзки за обмен на данни с други транспютри. Били са проектирани и произведени от Inmos, компания за полупроводници със седалище в Бристол, Обединеното кралство.
През 80-те години на миналия век много хора смятали транспютъра за следващото голямо постижение в областта на изчислителната техника. Въпреки че транспютърът не оправдал тези очаквания, неговата архитектура оказала силно влияние върху появата на нови идеи в областта на компютърната архитектура, някои от които се появяват отново в различни форми в съвременните системи.
Генезис
В началото на 80-те години на миналия век е изглеждало, че конвенционалните централни процесори (CPU) са достигнали границата на своята производителност. До този момент производствените трудности ограничавали броя схеми, които можело да бъдат поместени на един чип. Традиционните дизайни на компютри с комплексен набор от инструкции (CISC) достигнали плато в производителността и не било ясно дали то може да бъде преодоляно.
Изглеждало, че единственият начин да се продължи напред е чрез използването на паралелизъм, т.е. използването на няколко CPU, които да работят заедно, за да решават няколко задачи едновременно - процес, наречен мултитаскинг.
Страничен ефект на повечето мултитаскинг дизайни е, че често позволяват процесите да се изпълняват на физически различни процесори, който случай се нарича мултипроцесинг. Евтин процесор, създаден за мултипроцесинг, може да позволи увеличаване на скоростта на машината чрез добавяне на повече процесори, което потенциално е много по-евтино, отколкото използването на един по-бърз процесор.
Първите проекти за транспютри са дело на компютърния учен Дейвид Мей и телекомуникационния консултант Робърт Милн. През 1990 г. Мей получава почетното звание доктор на науките от Университета в Саутхемптън, а през 1991 г. е избран за член на Кралското дружество и получава медала „Патерсън“ на Института по физика през 1992 г. Тони Фюдж, тогава водещ инженер в Inmos, получава наградата „Принц Филип“ за дизайн през 1987 г. за работата си по транспютъра T414.
Дизайн
Транспютърът е бил първият микропроцесор за общо предназначение, проектиран специално за използване в паралелни изчислителни системи. Целта била да се произведе серия чипове с различна мощност и цена, които да могат да се свързват помежду си, за да образуват цялостен паралелен компютър. Името, съставено от „транзистор“ и „компютър“, било избрано, за да обозначи ролята, която отделните транспютри ще играят: много от тях били използвани като основни градивни елементи в по-голяма интегрирана система, точно както транзисторите са използвани в по-ранни проекти.
Първоначално планът бил транспютърът да струва само няколко долара на бройка. Inmos виждал тяхното приложение практически във всичко, от работа като основен процесор за компютър до ролята на канални контролери за дискови устройства в същата машина. В традиционна машина, например, процесорната мощност на дисковия контролер би била в режим на изчакване, когато дискът не се използва. За разлика от това, в транспютърна система, свободното време на всеки от тези транспютри може да се използва за други задачи, което значително увеличава общата производителност.
Транспютърът имал голяма вградена памет, което го правело по същество процесор в паметта. Дори един транспютър разполагал с цялата необходима схема, за да работи самостоятелно, което е характеристика, по-често срещана при микроконтролерите. Целта била транспютрите да могат да се свързват помежду си възможно най-лесно, без да е необходима сложна шина или дънна платка. Необходимо било да се осигури захранване и прост часовников сигнал и нищо друго: паметта с произволен достъп (RAM), RAM контролер, поддръжка на шината и дори операционна система в реално време (RTOS) били вградени. По този начин последните транспютри се превръщат в единични многократно използваеми микроядра (RMC) на тогава възникващия пазар на SoC.
Архитектура
Оригиналният транспютър използвал много проста и доста необичайна архитектура, за да постигне висока производителност на малка площ. Това ставало чрез микрокод като основен метод за контрол на пътя на данните, но за разлика от други проекти от онова време, много инструкции се изпълнявали само за един цикъл. Инструкционните операционни кодове се използвали като входни точки към микрокодовата памет само за четене (ROM), а изходите от ROM се подавали директно към пътя на данните. За инструкции с няколко цикъла, докато пътят на данните изпълнявал първия цикъл, микрокодът декодирал четири възможни опции за втория цикъл. Решението коя от тези опции да се използва всъщност можело да се вземе близо до края на първия цикъл. Това позволявало много бърза работа, като същевременно архитектурата оставала генерична.
Тактовата честота от 20 MHz била доста висока за онова време и дизайнерите били много загрижени за практическата възможност за разпределяне на толкова бърз тактов сигнал на платка. Бил използван по-бавен външен такт от 5 MHz, който бил умножен до необходимата вътрешна честота с помощта на фазово-синхронизирана верига (PLL). Вътрешният часовник всъщност имал четири неприпокриващи се фази и дизайнерите били свободни да използват каквато пожелаят комбинация, така че може да се твърди, че транспютърът всъщност е работел на 80 MHz. Динамичната логика била използвана в много части от дизайна, за да се намали площта и да се увеличи скоростта. За съжаление, тези методи са трудни за комбиниране с автоматично генериране на тестови модели за сканиране, така че са изпаднали в немилост при по-късните дизайни.
Връзки
Основният дизайн на транспютъра включвал серийни връзки, известни като „os-link“, които му позволявали да комуникира с до четири други транспютъра, всеки с 5, 10 или 20 Mbit/s – което била много бързо за 80-те години. Всяко количество транспютри можело да бъде свързано чрез връзки (които можело да достигат десетки метри) за да формират една изчислителна ферма. Хипотетична настолна машина можело да има два „нискокачествени” транспютъра, които да обработват задачи за вход/изход (I/O) на някоя от техните серийни линии (свързани с подходящ хардуер), докато комуникират с един от по-големите си братовчеди, действащ като CPU на друг.
Имало обаче ограничения за размера на системата, която можело да се изгради по този начин. Тъй като всеки транспютър била свързан с друг във фиксирана точка-до-точка конфигурация, изпращането на съобщения до по-далечен транспютър изисквало съобщенията да се препращат от всеки чип в линията. Това въвеждало забавяне при всеки „скок“ по връзката, което водело до дълги забавяния в големите мрежи. За да реши този проблем, Inmos предоставил превключвател с нулево забавяне, който свързвал до 32 транспютъра (или превключвателя) в още по-големи мрежи.
Зареждане
Транспютрите можели да зареждат от паметта, както е при повечето компютри, но също можели да зареждат и през мрежовите си връзки. Специален пин на чиповете, BootFromROM, показвал кой метод да се използва. Ако BootFromROM бил активиран при ресет на чипа, той започвал обработка от инструкцията на два байта от върха на паметта, която обикновено се използвала за обратно преминаване към кода за стартиране. Ако този пин не била активиран, чипът вместо това изчаквал да бъдат получени байтове по някоя мрежова връзка. Първият получен байт била дължината на кода, който следвал. Следващите байтове се копирали в долната памет и към тях се преминавало след получаването на този брой байтове.
Общата концепция за системата била един транспютър да действа като централна власт за стартиране на система, съдържаща няколко свързани транспютъра. Избраният транспютър е трябвало да има постоянно активиран BootFromROM, което щяло да го накара да започне да изпълнява процес на стартиране от ROM при включване. Другите транспютри трябвало да имат BootFromROM свързан ниско и просто да чакат. Зареждащият модул трябвало да стартира централния транспютър, който след това да започне да изпраща стартиращ код към другите транспютри в мрежата и да може да персонализира кода, изпратен към всеки един от тях, например да изпрати драйвер на устройство към транспютъра, свързан с твърдите дискове.
Системата включвала и „специални“ кодови дължини от 0 и 1, които били запазени за PEEK и POKE. Това позволявало проверка и промяна на RAM в нестартиран транспютър. След peek, последвано от адрес на паметта, или poke, с адрес и единична дума данни, транспютърът се връщал в режим на изчакване на bootstrap. Този механизъм се използвал обикновено за отстраняване на грешки.
Разпределяне
Била добавена схема за планиране на трафика по връзките. Процесите, които чакали за комуникация, автоматично се спирали, докато мрежовата схема завърши четенето или записването. Другите процеси, изпълнявани на транспютъра, получавали това време за обработка. Тя включвала две нива на приоритет за подобряване на работата в реално време и на многопроцесорната работа. Същата логическа система се използвала за комуникация между програми, изпълнявани на един транспютър, реализирани като виртуални мрежови връзки в паметта. Така програмите, които изисквали входни или изходни данни, автоматично се спирали, докато операцията приключвала задача, която обикновено изисквала операционна система да се справи като арбитър на хардуера. Операционните системи на транспютъра не се налагало да се занимават с планирането; чипът можело да се счита за имащ операционна система в себе си.
Набор от инструкции
За да включи всички тези функции в един чип, основната логика на транспютъра била по-опростена от тази на повечето процесори. Макар че някои го наричали компютър с редуциран набор от инструкции (RISC) поради неговата доста опростена природа и защото това била желана маркетингова модна дума по онова време, той бил силно микрокодиран, имал ограничен набор от регистри и сложни инструкции от памет към памет, което го поставяло твърдо в лагера на CISC. За разлика от RISC процесорите с много регистри за зареждане/съхранение, транспютърът имал само три регистъра за данни, които се държали като пакет. В допълнение, показалецът на работната област сочел към конвенционален пакет на паметта, лесно достъпен чрез инструкциите Load Local и Store Local. Това позволявало много бързо превключване на контекста чрез просто променяне на показалеца на работната област към паметта, използвана от друг процес (метод, използван в редица съвременни дизайни, като например TMS9900). Съдържанието на пакета с три регистъра не се запазвало след определени инструкции, като например Jump, при които транспютърът можело да направи превключване на контекста.
Наборът от инструкции на транспютъра се състоял от 8-битови инструкции, съставени от операционен код и нибли на операнда. Горният нибъл съдържал 16 възможни основни кода на инструкции, което го правело един от малкото комерсиализирани компютри с минимален набор от инструкции. Долният нибъл съдържал един непосредствен константен операнд, обикновено използван като отместване спрямо показалеца на работната област (паметта). Две инструкции с префикс позволявали конструирането на по-големи константи чрез добавяне на долните им нибъли към операндите на следващите инструкции. Допълнителни инструкции били поддържани чрез инструкционния код Operate (Opr), който декодирал константния операнд като разширен операционен код с нулев операнд, осигурявайки почти безкрайно и лесно разширяване на набора от инструкции с въвеждането на по-нови реализации на транспютъра.
Развитие
За да предостави лесен начин за прототипиране, конструиране и конфигуриране на системи с множество транспютри, Inmos въвел стандарта TRAM (TRAnsputer Module) през 1987 г. TRAM била по същество дъщерна платка, състояща се от транспютър и, по избор, външна памет и/или периферни устройства, с прости стандартизирани конектори, осигуряващи захранване, транспютърни връзки, часовник и системни сигнали. Били дефинирани различни размери на TRAM, от основния размер 1 TRAM (3,66 инча на 1,05 инча) до размер 8 (3,66 инча на 8,75 инча). Inmos произвеждал гама от TRAM дънни платки за различни хост шини, като Industry Standard Architecture (ISA), MicroChannel или VMEbus. TRAM връзките работели при 10 Mbit/s или 20 Mbit/s.
Софтуер
Транспютрите са предназначени за програмиране с помощта на програмния език occam, базиран на комуникационни последователни процеси (CSP). Транспютърът бил създаден специално за работа с Occam, за разлика от съвременните CISC дизайни, които са създадени за работа с езици като Pascal или C. Occam поддържал едновременност и канална междупроцесна или междупроцесорна комуникация като фундаментална част от езика. С паралелизма и комуникациите, вградени в чипа и езика, който взаимодейства директно с него, писането на код за неща като контролери на устройства станало тривиално; дори най-основният код можело да наблюдава серийните портове за вход/изход и автоматично да преминава в режим на сън, когато нямал данни.
Първоначалната среда за разработка на Occam за транспютъра била Inmos D700 Transputer Development System (TDS). Това била неортодоксална интегрирана среда за разработка, включваща редактор, компилатор, линкер и (постмортален) дебъгер. TDS била транспютърно приложение, написано на Occam. Текстовият редактор на TDS се отличавал с това, че била сгъваем редактор, позволяващ скриване и разкриване на блокове код, за да се направи структурата на кода по-ясна. За съжаление, комбинацията от непознат програмен език и също толкова непозната среда за разработка не допринесло за ранната популярност на транспютъра. Впоследствие Inmos предложил по-конвенционални Occam крос-компилатори, Occam 2 Toolsets.
След време Inmos и трети страни пуснали реализации на по-разпространени езици за програмиране, като C, FORTRAN, Ada, Forth и Pascal. Те обикновено включвали разширения на езика или библиотеки, които по не толкова елегантен начин осигурявали Occam-подобна паралелност и комуникация на базата на канали.
Липсата на поддръжка на виртуална памет от транспютъра възпрепятствало пренасянето на основните варианти на операционната система Unix, въпреки че били произведени портове на Unix-подобни операционни системи (като Minix и Idris от Whitesmiths). Усъвършенствана Unix-подобна разпределена операционна система, Helios, също била проектирана специално за мулти-транспютърни системи от Perihelion Software.
Приложения
Първите транспютри били обявени през 1983 г. и пуснати на пазара през 1984 г.
В съответствие с ролята си на устройства, подобни на микроконтролери, те включвали вградена RAM памет и вграден RAM контролер, което позволявало добавянето на повече памет без допълнителен хардуер. За разлика от другите дизайни, транспютрите не включвали I/O линии: те трябвало да се добавят с хардуер, свързан към съществуващите серийни връзки. Имали една линия „Събитие”, подобна на линията за прекъсване на конвенционалния процесор. Третирана като канал, програмата можело да „въведе” от канала за събития и да продължи едва след като линията за събития била потвърдена.
Всички транспютри работели с външен 5 MHz часовник; той се умножавал, за да се осигури часовникът на процесора.
Транспютърът не включвал модул за управление на паметта (MMU) или система за виртуална памет.
Вариантите на транспютъра (с изключение на отменения T9000) могат да бъдат разделени на три групи: 16-битова серия T2, 32-битова серия T4 и 32-битова серия T8 с 64-битова поддръжка на плаваща запетая IEEE 754.
T2: 16-битов
Inmos T225 чип
Прототипът на 16-битовия транспютър бил S43, който нямал планировчик и DMA-контролиран блоков трансфер по връзките. При пускането на пазара, T212 и M212 (последният с вграден дисков контролер) били с 16-битова архитектура. T212 се предлагал с тактова честота на процесора 17,5 и 20 MHz. T212 била заменен от T222, с RAM на чипа, разширен от 2 KB на 4 KB, а по-късно и от T225. Това добавило поддръжка за отстраняване на грешки и прекъсвания (чрез разширяване на инструкцията „J 0”), както и някои допълнителни инструкции от набора инструкции T800. T222, както и T225 работели на 20 MHz.
T4: 32-битов
Inmos T425 чип
Пуснат на пазара през октомври 1985 г., T414 използвал еквивалента на 900 000 транзистора и бил произведен с размер на елементите 1,5 микрометра. Той бил с 32-битова архитектура, способен да обработва 32-битови единици данни и да адресира до 4 GB основна памет. Първоначално първият 32-битов вариант трябвал да бъде T424, но поради трудности при производството той е преработен като T414 с 2 KB вградена RAM памет вместо планираните 4 KB. T414 се предлагал в варианти с 15 и 20 MHz. По-късно RAM паметта била възстановена до 4 KB в T425 (в варианти с 20, 25 и 30 MHz), който имал допълнително поддръжка на прекъсваща точка J0 и допълнителни инструкции T800. T400, пуснат на пазара през септември 1989 г., бил евтин 20 MHz T425 дериват с 2 KB и две вместо четири връзки, предназначен за пазара на вградени системи.
T8: плаваща запетая
Inmos T805 чип
Второто поколение T800 транспютър, представено през 1987 г., имало разширен набор от инструкции. Най-важното допълнение била 64-битовата плаваща запетая (FPU) и три добавени регистъра за плаваща запетая, реализиращи стандарта IEEE 754-1985 за плаваща запетая. Той също така имал 4 KB вградена RAM памет и се предлагал във версии с 20 или 25 MHz. Поддръжка на прекъсвания била добавена в по-късните T801 и T805, като първият разполагал с отделни адресни и шини за данни за подобряване на производителността. T805 по-късно бил наличен и с 30 MHz честота.
Бил планиран подобрен T810, който щял да има повече RAM, повече и по-бързи връзки, допълнителни инструкции и подобрен микрокод, но това била отменено около 1990 г.
Inmos произвеждал и различни чипове за поддръжка на транспютърните процесори, като 32-канален превключвател C004 и „адаптери за връзки“ C011 и C012, които позволявали транспютърните връзки да се свързват с 8-битова шина за данни.
T400
Част от първоначалната стратегия на Inmos била да се произвеждат толкова малки и евтини процесори, че да могат да се комбинират с друга логика в едно устройство. Въпреки че системите на чип (SoC), както обикновено се наричат, са широко разпространени днес, тази концепция била почти непозната в началото на 80-те години. Около 1983 г. били стартирани два проекта – M212 и TV-toy. M212 се базирал на стандартно ядро T212 с добавен дисков контролер за стандартите ST 506 и ST 412 Shugart. TV-toy трябвал да бъде основа за конзола за видеоигри и бил съвместен проект между Inmos и Sinclair Research.
Връзките в транспютрите T212 и T414/T424 имали хардуерни DMA двигатели, така че прехвърлянията да могат да се извършват успоредно с изпълнението на други процеси. Вариант на дизайна, наречен T400, който не трябва да се бърка с по-късен транспютър със същото име, бил проектиран така, че CPU да обработва тези прехвърляния. Това намалило значително размера на устройството, тъй като 4 връзки били приблизително със същия размер като целият CPU. T400 бил предназначен да се използва като ядро в устройствата, наречени тогава системи на силиций (SOS), които днес са по-известни като системи на чип (SoC). Именно този дизайн трябвал да бъде част от TV-toy. Проектът бил отменен през 1985 г.
T100
Въпреки че предишните SoC проекти имали само ограничен успех (M212 се продавал за известно време), много дизайнери продължавали да вярват твърдо в концепцията и през 1987 г. бил стартиран нов проект, T100, който комбинирал 8-битова версия на транспютърния CPU с конфигурируема логика, базирана на състоятелни машини. Наборът от инструкции на транспютъра се базирал на 8-битови инструкции и можел лесно да се използва с всякаква дължина на думата, която е кратна на 8 бита. Целевият пазар за T100 били автобусните контролери като Futurebus и ъпгрейд за стандартните линк адаптери (C011 и др.). Проектът бил спрян поради стартиране на T840 (по-късно станал основа на T9000).
Inmos подобрили производителността на транспютрите от серия T8 с въвеждането на T9000 (кодово име H1 по време на разработката). T9000 споделял повечето характеристики с T800, но се различавал с няколко части от дизайна на хардуера и добавянето на няколко функции за суперскаларна поддръжка. За разлика от по-ранните модели, T9000 имал истинска 16 KB високоскоростна кеш памет (използваща произволна замяна) вместо RAM, но също така позволявал да се използва като памет и включвал MMU-подобна функционалност, за да се справи с всичко това (наречена PMI). За по-голяма скорост T9000 кеширал първите 32 места от пакета, вместо първите три, както в по-ранните версии.
T9000 използвал петстепенен канал за още по-голяма скорост. Интересно допълнение бил групиращият модул, който събирал инструкции от кеша и ги групирал в по-големи пакети от до 8 байта, за да захранва канала по-бързо. Групите след това се изпълнявали в един цикъл, като че ли били единични по-големи инструкции, работещи на по-бърз процесор.
Системата за връзка била надградена до нов 100 MHz режим, но за разлика от предишните системи, връзките вече не били обратно съвместими. Този нов пакетен протокол за връзка била наречен DS-Link и по-късно послужил като основа за стандарта за серийна връзка IEEE 1355. T9000 добавил и хардуер за маршрутизиране на връзки, наречен VCP (Virtual Channel Processor), който променил връзките от точка-до-точка в истинска мрежа, позволявайки създаването на произволен брой виртуални канали по връзките. Това означавало, че програмите вече не трябвало да са запознати с физическото разположение на връзките. Били разработени и редица чипове за поддръжка на DS-Link, включително 32-канален кросбар превключвател C104 и адаптер за връзка C101.
Дългите забавяния в разработката на T9000 означавали, че по-бързите дизайни за зареждане/съхранение вече го превъзхождали по производителност към момента на излизането му на пазара. Той последователно не успявал да достигне собствената си цел за производителност да надмине T800 десет пъти. Когато проектът най-накрая бил отменен, той все още постигал само около 36 MIPS при 50 MHz. Забавянията в производството дали повод за шегата, че най-добрата хост архитектура за T9000 е шрайбпроектор.
Това било прекалено много за Inmos, която не разполагала с необходимите средства за продължаване на разработката. Към този момент компанията била продадена на SGS-Thomson (сега STMicroelectronics), чийто фокус бил пазарът на вградени системи и в крайна сметка проектът T9000 бил изоставен. Въпреки това, по-късно започнало производството на изцяло преработен 32-битов транспютър, предназначен за вградени приложения - серията ST20, като били използвани някои технологии, разработени за T9000. Ядрото на ST20 било включено в чипсети за приложения за декодери и глобална система за позициониране (GPS).
ST20
Въпреки че не е строго транспютър, ST20 е силно повлиян от T4 и T9 и формира основата на T450, който може да се счита за последния от транспютрите. Мисията на ST20 е да бъде ядро за многократна употреба на тогавашния нововъзникващ пазар на SoC. Първоначалното име на ST20 е Reusable Micro Core (RMC). Архитектурата му била свободно базирана на оригиналната архитектура на T4 с микрокод-контролиран път на данните. Въпреки това, той бил напълно преработен, като за език на проектиране е използван VHDL с оптимизиран (и пренаписан) микрокод компилатор. Проектът бил замислен още през 1990 г., когато станало ясно, че T9 ще бъде прекалено голям за много приложения. Действителната работа по проектирането започнало в средата на 1992 г. Били направени няколко пробни дизайна, вариращи от много прост CPU в стил RISC с комплексни инструкции, имплементирани в софтуера чрез капани, до доста сложен суперскаларен дизайн, подобен по концепция на алгоритъма на Томасуло. Окончателният дизайн изглеждал много подобен на оригиналния T4 core, въпреки че добавили някои прости групировки на инструкции и кеш на работната среда, за да се подобри производителността.
Пазарен прием
Въпреки че транспютърът бил опростен, но мощен в сравнение с много свои съвременни дизайни, той никога не се доближил до целта си да бъде използван универсално както в ролята на CPU, така и в ролята на микроконтролер. На пазара на микроконтролери доминирали 8-битовите машини, където цената била най-важният фактор. Тук дори T2 е бил прекалено мощен и скъп за повечето потребители.
В областта на настолните компютри и работните станции транспютърът бил доста бърз (работел с около 10 милиона инструкции в секунда (MIPS) при 20 MHz). Това била отлична производителност за началото на 80-те години, но когато T800, оборудван с плаваща запетая (FPU), бил пуснат на пазара, други RISC дизайни го били надминали. Това би могло да бъде до голяма степен смекчено, ако машините бяха използвали няколко транспютъра, както било планирано, но T800 струвал около 400 долара при пускането си на пазара, което означавало лошо съотношение цена/производителност. Били проектирани малко работни станции на базата на транспютър; най-забележителната вероятно е Atari Transputer Workstation.
Транспютърът бил по-успешен в областта на масово паралелните изчисления, където в края на 80-те години на миналия век няколко производители създали системи на базата на транспютъри. Сред тях са Meiko Scientific (основана от бивши служители на Inmos), Floating Point Systems, Parsytec и Parsys. Няколко британски академични институции започнали изследователски дейности в областта на приложението на паралелни системи, базирани на транспютър, включително Bristol Transputer Centre на Bristol Polytechnic и Edinburgh Concurrent Supercomputer Project на Университета в Единбург. Освен тях, на мрежа от над 300 синхронизирани транспютъра, разделени на няколко подсистеми се базират системите за събиране на данни и второ ниво на задействане на експеримента ZEUS по физика на високите енергии за ускорителя Hadron Elektron Ring Anlage (HERA) в DESY. Те освен, че контролират отчитането на специалната електроника на детектора, също така и изпълняват алгоритми за реконструкция при избор на физични събития.
Възможностите за паралелна обработка на транспютъра били използвани в търговски мащаб за обработка на изображения от най-голямата печатница в света, RR Donnelley & Sons, в началото на 90-те години. Възможността за бързо преобразуване на цифрови изображения в подготовка за печат дало на фирмата значително предимство пред конкурентите ѝ. Това развитие било ръководено от Майкъл Бенгтсон в технологичния център на RR Donnelley. Но в рамките на няколко години, обработващите способности дори на настолните компютри премахнали нуждата от специални мултипроцесорни системи за компанията.
Немската компания Jäger Messtechnik използвала транспютри за своите ранни продукти за събиране и контрол на данни в реално време ADwin.
Френска компания построила суперкомпютъра Archipel Volvox с до 144 транспютъра T800 и T400. Той се контролирал от Silicon Graphics Indigo2 с UNIX и специална карта, която се свързвала с базовите платки на Volvox.
Транспютрите намерили приложение и в протоколни анализатори като Siemens/Tektronix K1103, както и във военни приложения, където матричната архитектура била подходяща за приложения като радар и серийни връзки (които били с висока скорост през 80-те години) и служело добре за спестяване на разходи и тегло в комуникациите на подсистемите.
Транспютрите се появяват и в продукти, свързани с виртуалната реалност, като системата ProVision 100, произведена от Division Limited от Бристол, която включва комбинация от процесори Intel i860, 80486/33 и Toshiba HSP, заедно с транспютъри T805 или T425, реализиращи рендеринг двигател, до който може да се получи достъп като сървър от PC, Sun SPARCstation или VAX системи.
Myriade, европейска миниатюрна сателитна платформа, разработена от Astrium Satellites и CNES и използвана от сателити като Picard, е базирана на T805 с производителност около 4 MIPS и била планирана да остане в производство до около 2015 г.
Асинхронната работа на комуникациите и изчисленията позволила разработването на асинхронни алгоритми, като алгоритъма на Бейн „Asychronous Polynomial Zero Finding” (Асинхронно намиране на нулеви полиноми). Областта на асинхронните алгоритми и асинхронното прилагане на настоящите алгоритми вероятно ще играят ключова роля в прехода към изчисления в екзаскала.
Космическият апарат High Energy Transient Explorer 2 (HETE-2) използвал 4× T805 транспютъра и 8× DSP56001, постигайки производителност от около 100 милиона инструкции в секунда (MIPS).
Наследство
Тази секция е написана като лично разсъждение, лично есе или аргументативно есе, в което се изразяват личните чувства на редактор на Уикипедия или се представя оригинален аргумент по дадена тема. Моля, помогнете за подобряването й, като я пренапишете в енциклопедичен стил. (февруари 2019 г.) (Научете как и кога да премахнете това съобщение)
Нарастващият вътрешен паралелизъм е една от движещите сили зад подобренията в конвенционалните дизайни на CPU. Вместо експлицитен паралелизъм на ниво нишка (какъвто се използва в транспютъра), дизайните на CPU експлоатират имплицитен паралелизъм на ниво инструкция, като проверяват последователности от код за зависимости на данни и издават множество независими инструкции към различни изпълнителни единици. Това се нарича суперскаларна обработка. Суперскаларните процесори са подходящи за оптимизиране на изпълнението на последователно конструирани фрагменти от код. Комбинацията от суперскаларна обработка и спекулативно изпълнение доведе до осезаемо повишаване на производителността на съществуващите кодове, които бяха написани предимно на Pascal, Fortran, C и C++. Предвид тези съществени и редовни подобрения в производителността на съществуващия код, нямал голям стимул за пренаписване на софтуера на езици или стилове на кодиране, които разкриват повече паралелизъм на ниво задачи.
Въпреки това, моделът на сътрудничещи си паралелни процесори все още може да бъде открит в клъстерните изчислителни системи, които доминират в дизайна на суперкомпютрите през 21-ви век. За разлика от транспютърната архитектура, процесорните единици в тези системи обикновено използват суперскаларни CPU с достъп до значителни количества памет и дисково пространство, работещи с конвенционални операционни системи и мрежови интерфейси. В резултат на по-сложните възли, софтуерната архитектура, използвана за координиране на паралелизма в такива системи, обикновено е много по-тежка от тази в транспютърната архитектура.
Фундаменталната мотивация за транспютъра остава, но била скрита в продължение на над 20 години от многократното удвояване на броя на транзисторите. Неизбежно, дизайнерите на микропроцесори най-накрая изчерпаха възможностите за използване на по-големите физически ресурси, почти по същото време, когато технологичното мащабиране започна да достига своите граници. Консумацията на енергия и оттам необходимостта от разсейване на топлината правят по-нататъшното увеличаване на тактовата честота невъзможно. Тези фактори насочиха индустрията към решения, които по същество се различават малко от предложените от Inmos.
Някои от най-мощните суперкомпютри в света, базирани на проекти на Колумбийския университет и произведени като IBM Blue Gene, са реални въплъщения на мечтата за транспютъра. Те са огромни сборки от идентични, относително нископроизводителни SoC.
Последните тенденции също се опитват да решат дилемата с транзисторите по начини, които биха били твърде футуристични дори за Inmos. Освен добавянето на компоненти към чипа на процесора и поставянето на няколко чипа в една система, съвременните процесори все по-често поставят няколко ядра в един чип. Проектантите на транспютри се мъчеха да поберет дори едно ядро в бюджета си за транзистори. Днес проектантите, работещи с 1000-кратно увеличение на плътността на транзисторите, могат да поставят много ядра. Едно от най-новите търговски разработки е на фирмата XMOS, която е разработила серия вградени многоядрени многонишкови процесори, които силно напомнят на транспютъра и Inmos. Появява се нова класа многоядрени/многонишкови процесори, които използват подхода на мрежа на чип (NoC), като например процесорът Cell, архитектурата Adapteva Epiphany, Tilera и др."
Край на цитата.