서평 = ⅳ추천의 글 = ⅴ옮긴이의 말 = ⅵ저자 서문 = xvi감사의 글 = xvii들어가며 = xviii1장 컴퓨터 동작의 기본 개념 = 1계산기 모델 = 2문서관리원 모델 = 3스토어 프로그램 컴퓨터 = 4문서관리원 모델 다시 보기 = 6레지스터 파일 = 7RAM : 레지스터만으로는 부족할 때 = 8문서관리원 모델의 확장 = 9예 : 두 수 더하기 = 10코드 스트림 살펴 보기 : 프로그램 = 10명령어의 종류 = 11DLW_1 기본 아키텍처 및 산술 명령어 포맷 = 12메모리 접근 자세히 보기 : 레지스터와 직접값 비교 = 14직접값 = 14상대 레지스터 주소 지정 = 162장 프로그램 실행의 원리 = 19연산코드와 기계어 = 19DLW_1의 기계어 = 19산술 명령어의 바이너리 인코딩 = 21메모리 접근 명령어의 바이너리 인코딩 = 23예제 프로그램을 기계어로 바꾸기 = 25프로그래밍 모델과 ISA = 26프로그래밍 모델 = 26명령어 레지스터와 프로그램 카운터 = 26명령어 페치 : 명령어 레지스터 채우기 = 28간단한 프로그램 실행 예제 : 페치_실행 루프 = 28클럭 = 29분기 명령어 = 30무조건 분기 = 30조건 분기 = 30부록 : 부팅 = 343장 파이프라인 = 35명령어의 생명 주기 = 36명령어의 기본 흐름 = 38파이프라인 = 40프로세서에의 적용 = 43단일 사이클 프로세서 = 43파이프라인 프로세서 = 45파이프라인으로 인한 속도 향상 = 48프로그램 수행시간과 완료율 = 51프로그램 수행시간과 완료율의 관계 = 52명령어 산출량과 파이프라인 멈춤 = 53명령어 지연시간과 파이프라인 멈춤 = 57파이프라인의 한계 = 584장 슈퍼스칼라 수행 = 61수퍼스칼라 수행과 IPC = 64수퍼스칼라의 수행 유닛 = 65기본적인 숫자 포맷과 산술 연산 = 66산술 논리 유닛 = 67메모리 접근 유닛 = 69마이크로아키텍처와 ISA = 69ISA의 익사 = 71복잡한 하드웨어에서 복잡한 소프트웨어로 = 73파이프라인 및 수퍼스칼라 설계에 따른 변화 = 74데이터 해저드 = 74구조 해저드 = 76레지스터 파일 = 77제어 해저드 = 785장 펜티엄 = 79오리지널 펜티엄 = 80캐쉬 = 81펜티엄 프로세서의 파이프라인 = 82분기 유닛과 분기 예측 = 85펜티엄 프로세서의 백엔드 = 87펜티엄의 x86 지원 = 91정리 : 역사적 관점에서 본 펜티엄 프로세서 = 92인텔 P6 마이크로아키텍처 : 펜티엄 프로 = 93프론트엔드와 백엔드의 분리 = 94P6 파이프라인 = 100P6에서의 분기 예측 = 102P6 백엔드 = 102CISC, RISC 및 명령어 변환 = 103P6 마이크로아키텍처의 명령어 디코드 유닛 = 105P6의 x86 지원 = 107정리 : 역사적 관점에서 본 P6 마이크로아키텍처 = 107결론 = 1106장 파워PC 프로세서 : 600 계열, 700 계열, 1400 계열 = 111파워PC의 역사 = 111파워PC 601 = 112601의 파이프라인과 프론트엔드 = 112601의 백엔드 = 115지연시간과 산출량 다시 보기 = 117정리 : 역사적 관점에서 본 601 = 118파워PC 603과 603e = 119603의 백엔드 = 120603e의 프론트엔드, 명령어 창, 분기 예측 = 122정리 : 역사적 관점에서 본 603과 603e = 123파워PC 604 = 123604의 파이프라인과 백엔드 = 123604의 프론트엔드와 명령어 창 = 126정리 : 역사적 관점에서 본 604 = 129파워PC 604e = 129파워PC 750(G3) = 130705의 프론트엔드, 명령어 창, 분기 명령어 = 130정리 : 역사적 관점에서 본 705 = 132파워PC 7400(G4) = 133G4의 벡터 유닛 = 135정리 : 역사적 관점에서 본 G4 = 135결론 = 1357장 인텔 펜티엄 4와 모토로라 G4e = 137속도 중독 : 펜티엄 4 = 138펜티엄 4와 G4e의 문제 접근 방법과 설계 철학 = 140G4e 아키텍처 및 파이프라인 = 144스테이지 1, 2 : 명령어 페치 = 145스테이지 3 : 디코드/디스패치 = 145스테이지 4 : 이슈 = 146스테이지 5 : 수행 = 146스테이지 6, 7 : 완료 및 쓰기 = 147G4e와 펜티엄 4에서의 분기 예측 = 147펜티엄 4 아키텍처 = 148명령어 창의 확장 = 149트레이스 캐쉬 = 149펜티엄 4의 파이프라인 = 155스테이지 1, 2 : 트레이스 캐쉬 _ 포인터 = 155스테이지 3, 4 : 트레이스 캐쉬 _ 페치 = 155스테이지 5 : 드라이브 = 155스테이지 6∼8 : 할당 및 리네임(ROB) = 155스테이지 9 : 큐 = 156스테이지 10∼12 : 스케줄링 = 156스테이지 13∼14 : 이슈 = 157스테이지 15∼16 : 레지스터 파일 = 158스테이지 17 : 수행 = 158스테이지 18 : 플래그 = 158스테이지 19 : 분기 점검 = 158스테이지 20 : 드라이브 = 158스테이지 21 이후 : 완료 및 커밋 = 159펜티엄 4의 명령어 창 = 1598장 펜티엄 4와 모토로라 G4e : 백엔드 = 161피연산자 포맷 = 161정수 수행 유닛 = 162G4e의 IU : 자주 발생하는 경우를 빠르게 = 163펜티엄 4의 IU : 자주 발생하는 경우를 2배 빠르게 = 164부동소수점 유닛 = 165G4e의 FPU = 166펜티엄 4의 FPU = 167G4e와 펜티엄 4의 FPU에 대한 맺음말 = 168벡터 수행 유닛 = 168벡터 연산이란 = 168벡터 다시 보기 : 알티벡 명령어 = 169알티벡 벡터 연산 = 170G4e의 VU : 제대로 구현된 SIMD = 173인텔 MMX = 174SSE와 SSE2 = 175펜티엄 4의 벡터 유닛 = 176SSE2를 사용한 부동소수점 성능 향상 = 177결론 = 1779장 64비트 컴퓨터와 x86_64 = 179인텔 IA_64와 AMD x86_64 = 179왜 64비트인가? = 18164비트 컴퓨터란? = 18164비트의 활용 영역 = 183표현 영역 = 183표현 범위 증가로 인한 이득 = 184가상 주소 공간과 물리 주소 공간 = 18564비트 주소의 이점 = 18664비트 x86 : x86_64 = 187레지스터의 확장 = 187레지스터 수의 증가 = 187모드 변환 = 189오래된 기능의 퇴출 = 192결론 = 19210장 G5 : IBM 파워PC 970 = 193설계 철학 = 194캐쉬와 프론트엔드 = 194분기 예측 = 195트레이드오프 : 디코드, 크랙, 그룹 = 196970의 디스패치 규칙 = 198프리디코드와 그룹 디스패치 = 199970의 그룹 디스패치 기법에 대한 결론 = 199파워PC 970의 백엔드 = 200정수 유닛, 조건 레지스터 유닛, 분기 유닛 = 200동일하지 않은 정수 유닛 = 201정수 유닛 지연시간 및 산출량 = 202CRU = 202970의 정수 성능에 대한 결론 = 203로드 스토어 유닛 = 203프론트 사이드 버스 = 204부동소수점 유닛 = 205파워PC 970에서의 벡터 처리 = 206부동소수점 이슈 큐 = 209정수 및 로드 스토어 이슈 큐 = 210BU 및 CRU 이슈 큐 = 210벡터 이슈 큐 = 211970 그룹 디스패치 기법의 성능 = 211결론 = 21311장 캐쉬와 시스템 성능 = 215캐쉬의 기초 = 2151차 캐쉬 = 2172차 캐쉬 = 218예 : 메모리 계층 내에서의 데이터 이동 = 219캐쉬 미스 = 220데이터/코드의 집약성 = 220데이터의 공간 집약성 = 221코드의 공간 집약성 = 221코드와 데이터의 시간 집약성 = 223집약성 : 결론 = 224캐쉬의 구조 : 블록과 블록 프레임 = 224태그 RAM = 225완전 연관 매핑 = 226집적 매핑 = 227N웨이 집합 연관 매핑 = 2284웨이 집합 연관 매핑 = 2282웨이 집합 연관 매핑 = 2302웨이 집합 연관 매핑과 직접 매핑 = 2312웨이 집합 연관 매핑과 4웨이 집합 연관 매핑 = 231캐쉬의 집합 연관성 : 결론 = 232시간/공간집약성 다시 보기 : 교체 정책 및 블록 크기 = 232교체/방출 정책의 종류 = 233블록 크기 = 233쓰기 정책 : 라이트 스루와 라이트 백 = 235결론 = 23612장 인텔 펜티엄 M, 코어 듀오, 코어 2 듀오 = 237코드명과 브랜드명 = 237전력 효율성을 중시한 컴퓨터의 등장 = 238전력 밀도 = 239동적 전력 밀도 = 239정적 전력 밀도 = 240펜티엄 M = 241페치 단계 = 241디코드 단계 : 마이크로옵 퓨전 = 242분기 예측 = 246스택 수행 유닛 = 248파이프라인과 백엔드 = 248정리 : 역사적 관점에서 본 펜티엄 M 프로세서 = 248코어 듀오/솔로 = 249인텔이 설계한 멀티코어 프로세서 = 249코어 듀오의 기능 향상 = 253정리 : 역사적 관점에서 본 코어 듀오 = 256코어 2 듀오 = 256페치 단계 = 258디코드 단계 = 259코어의 파이프라인 = 260코어의 백엔드 = 260향상된 벡터 처리 = 264메모리 명확화 : 예측 수행의 결과 스트림 버전 = 266정리 :역사적 관점에서 본 코어 2듀오 = 272참고 문헌 = 273찾아보기 = 277