컴퓨터에있는 모든 캐시가 있습니다.

다음으로 시작할 수 있습니다.:

최신 프로세서는 3 레벨 캐시를 사용하므로 캐시 레벨 계층 구조와 아키텍처를 이해하고 싶습니다.

캐시를 이해하려면 몇 가지 사항을 알아야합니다.

그러나 우리는 칩에 무한 레지스터를 추가 할 수 없습니다. 이러한 것들이 공간을 차지합니다. 우리가 칩을 더 크게 만들면 더 비싸게됩니다. 우리가 더 큰 칩(더 실리콘)를 필요로하기 때문에 그 부분이지만,또한 문제 칩의 수가 증가하기 때문이다.

(500 센티미터 2 의 가상 웨이퍼를 이미지화한다. 나는 그것을 잘라 10 칩,각 칩 50 센티미터 2 크기. 그 중 하나가 고장났습니다. 나는 그것을 버리고 나는 그것을 왼쪽입니다 9 작업 칩. 이제 같은 웨이퍼를 가지고 나는 작은 각 10 배,그것에서 100 칩을 잘라. 그 중 하나가 깨진 경우. 나는 깨진 칩을 버리고 99 개의 작업 칩이 남아 있습니다. 그것은 내가 그렇지 않으면 가지고 있었을 손실의 일부분입니다. 더 큰 칩을 보상하기 위해 나는 더 높은 가격을 요청해야합니다. 추가 실리콘의 가격 이상)

이것은 우리가 작고 저렴한 칩을 원하는 이유 중 하나입니다.

그러나 캐시가 중앙 처리 장치에 가까울수록 더 빨리 액세스 할 수 있습니다.

이것은 또한 설명하기 쉽다;전기 신호는 빛의 속도에 가까운 여행. 그것은 빠르지 만 여전히 유한 한 속도입니다. 시계. 그것은 또한 빠릅니다. 나는 4 기가 헤르쯔 프로세서를 가지고가는 경우에 전기 신호는 시계 틱 당 약 7.5 센티미터를 여행 할 수있다. 즉 7.5 센치메터 직선. (칩은 직선 연결 아무것도하지만 있습니다). 실제로 당신은 그 7.5 센티미터 칩이 요청 된 데이터를 제시하고 신호가 다시 여행 할 수있는 시간을 허용하지 않기 때문에 훨씬 덜 필요합니다.

결론,우리는 가능한 한 물리적으로 가까운 캐시를 원한다. 큰 칩을 의미합니다.

이 두 가지는 균형을 이루어야합니다(성능 대 비용).

컴퓨터에 엘 1,엘 2 및 엘 3 캐시는 정확히 어디에 있습니까?

원래 4.77 메가 헤르츠 하나:캐시 없음. 메모리에 직접 액세스합니다. 메모리에서 읽기 이 패턴을 따를 것 이다:

메모리는 데이터 버스에 데이터를 넣습니다.
중앙 처리 장치는 데이터 버스의 데이터를 내부 레지스터로 복사한다.

80286 (1982)
여전히 캐시가 없습니다. 메모리 액세스는 낮은 속도 버전에 대한 큰 문제가되지 않았다(6 백만헤르쯔),하지만 빠른 모델은 최대 실행 20 백만헤르쯔 종종 메모리에 액세스 할 때 지연하는 데 필요한.

그런 다음 다음과 같은 시나리오를 얻습니다:

메모리가 데이터를 데이터 버스에 넣기 시작합니다. 이 문제를 해결했습니다.
메모리가 데이터 가져 오기를 완료했으며 이제 데이터 버스에서 안정적입니다.
중앙 처리 장치는 데이터 버스의 데이터를 내부 레지스터로 복사한다.

이것은 메모리를 기다리는 추가 단계입니다. 쉽게 우리가 캐시를 왜 12 단계가 될 수있는 현대적인 시스템에.

80386: (1985)
더 빨리 얻을 수 있습니다. 시계 당,더 높은 클럭 속도로 실행하여 모두.
램은 더 빨라지지만 더 빠르지는 않다.
결과적으로 더 많은 대기 상태가 필요합니다.일부 마더 보드는 마더 보드에 캐시(즉,1 레벨 캐시 것)을 추가하여이 문제를 해결합니다.

이제 메모리에서 읽기가 시작되어 데이터가 이미 캐시에 있는지 확인합니다. 이 경우 훨씬 빠른 캐시에서 읽습니다. 설명 된 것과 동일한 절차가 아닌 경우 80286

80486: (1989)
이 응용 프로그램은 모든 장치에서 작동합니다.
그것은 데이터 및 지침에 사용되는 것을 의미 8 킬로바이트 통합 캐시입니다.

이 무렵에는 256 킬로바이트의 빠른 정적 메모리를 2 단계 캐시로 마더 보드에 넣는 것이 일반적입니다. 따라서 1 레벨 캐시,마더 보드의 2 레벨 캐시.

486 중앙 처리 장치 위치 및 2 레벨 캐시가 표시된 마더 보드

80586 (1993)
586 또는 펜티엄-1 은 분할 수준 1 캐시를 사용합니다. 데이터 및 지침 8 킬로바이트 각. 데이터 및 명령어 캐시를 특정 용도로 개별적으로 조정할 수 있도록 캐시를 분할했습니다. 당신은 여전히 중앙 처리 장치 근처에 작은 아직 매우 빠른 1 캐시,마더 보드에 큰하지만 느린 2 캐시가 있습니다. (더 큰 물리적 거리에서).

같은 펜티엄 1 영역에서 인텔은 펜티엄 프로(‘80686’)를 생산했습니다. 모델에 따라이 칩은 보드 캐시에 2 백 56 킬로바이트,5 백 12 킬로바이트 또는 1 메가바이트했다. 그것은 또한 훨씬 더 비싼,다음 그림으로 설명 하기 쉬운.1644>

칩의 절반 공간이 캐시에 의해 사용된다는 것을 알 수 있습니다. 그리고 이것은 256 킬로바이트 모델입니다. 더 많은 캐시는 기술적으로 가능했고 5 백 12 킬로바이트 및 1 메가바이트 캐시로 생산 일부 모델. 이들에 대한 시장 가격은 높았다.

이 칩에는 두 개의 다이가 포함되어 있습니다. 는 실제 프로세서와 1 캐시,2 백 56 킬로바이트 2 캐시와 두 번째 다이 하나.

펜티엄-2

펜티엄 2 는 펜티엄 프로 코어입니다. *********** 이 응용 프로그램은 1 차 캐시 및 2 차 캐시에 대한 별도의 칩이 포함되어 있습니다.

기술이 발전함에 따라 우리는 더 작은 구성 요소로 칩을 만들기 시작하면서 실제 프로세서 다이에 두 번째 캐시를 다시 넣는 것이 재정적으로 가능합니다. 그러나 여전히 분열이 있습니다. 매우 빠른 1 캐시가 중앙 프로세서에 붙어 있습니다. 100%무료!

펜티엄 2'프로세서'그림(커버 유무 모두)

펜티엄-3
펜티엄-4
펜티엄-3 또는 펜티엄-4 에 대해서는 변경되지 않습니다.

이 무렵에 우리는 얼마나 빨리 우리가 할 수 있는지에 대한 실질적인 한계에 도달했습니다. 8086 또는 80286 은 냉각 할 필요가 없었습니다. 펜티엄-4 3.0 기가 헤르쯔에서 실행 너무 많은 열을 생산 하 고 더 실용적인 하나의 빠른 하나 보다는 마더보드에 두 개의 별도 중앙 처리 장치의 넣어 그 많은 전력을 사용 합니다.2.0 기가 헤르쯔 프로세서는 하나의 동일한 3.0 기가 헤르쯔 프로세서보다 적은 전력을 사용하지만 더 많은 작업을 수행 할 수 있습니다.

이것은 세 가지 방법으로 해결 될 수 있습니다:

같은 속도로 더 많은 작업을 할 수 있도록 합니다.같은’칩’에 여러 개의 컴퓨터를 사용합니다.

1) 는 진행중인 프로세스입니다. 그것은 새로운 것이 아니며 멈추지 않을 것입니다.2)는 초기에 수행되었습니다(예:듀얼 펜티엄 -1 마더 보드 및 칩셋). 지금까지 빠른 컴퓨터를 구축 할 수있는 유일한 옵션이었다.3)단일 칩에 여러 개의’프로세서 코어’를 구축해야 합니다. (우리는 그 혼란을 증가시키기 위해 듀얼 코어 프로세서를 호출했습니다. 당신을 감사하는 마케팅:))

이러한 일을 우리는 그냥 참조로 CPU’core’혼동을 피하기 위해.

이제 같은 칩에 기본적으로 두 개의 펜티엄-4 코어 인 펜티엄 디(듀오)와 같은 칩을 얻습니다.2015 년 11 월 1 일,2015 년 11 월 1 일)

이전 펜티엄-프로의 사진을 기억 하는가? 거대한 캐시 크기?
이 그림에서 두 개의 큰 영역이 보입니까?

두 프로세서 코어 사이에 두 번째 캐시를 공유 할 수 있음이 밝혀졌습니다. 속도는 약간 떨어지지 만 512 킵 공유 2 차 캐시는 종종 절반 크기의 두 개의 독립적 인 2 차 레벨 캐시를 추가하는 것보다 빠릅니다.

이것은 귀하의 질문에 중요합니다.

즉,하나의 중앙 처리 장치 코어에서 무언가를 읽고 나중에 동일한 캐시를 공유하는 다른 코어에서 읽으려고하면 캐시 히트를 얻을 수 있음을 의미합니다. 메모리에 액세스 할 필요가 없습니다.따라서,코어와 스케줄러의 부하에 따라 동일한 데이터를 사용하는 프로그램을 동일한 프로세서에 고정함으로써 추가적인 성능을 얻을 수 있다.

따라서 이후 모델에서는 공유 수준 2 캐시를 볼 수 있습니다.2015 년 11 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일:

귀찮게 하지 마십시오. 운영 체제는 일을 예약 할 수 있어야합니다. 스케줄러는 컴퓨터의 성능에 큰 영향을 미치고 사람들은 이것을 최적화하는 데 많은 노력을 기울였습니다. 당신이 이상한 일을하거나 컴퓨터의 하나의 특정 모델에 최적화되지 않는 한 당신은 기본 스케줄러와 더 나은입니다.
당신이 성능의 모든 마지막 비트를 필요로하고 빠른 하드웨어가 옵션이 아닌 경우,공유 캐시에 액세스 할 수있는 동일한 코어 또는 코어에 동일한 데이터에 액세스 트레드를 떠나보십시오.

나는 아직 엘 3 캐시를 언급하지 않은 것을 알고 있지만,그들은 다르지 않다. 엘 3 캐시는 같은 방식으로 작동합니다. 2 보다 크고,2 보다 느립니다. 그리고 그것은 종종 코어간에 공유됩니다. 이 존재하는 경우는 엘 2 캐시보다 훨씬 더 큰(다른 그것을 갖는 것은 이해가되지 않을 것이다)그것은 종종 모든 코어와 공유됩니다.

어디 정확히 엘 1,엘 2 과 엘 3 컴퓨터에 위치한 캐시?

Published by admin

답글 남기기 응답 취소