Skip to content

Latest commit

 

History

History
464 lines (349 loc) · 33.1 KB

linux-timers-2.md

File metadata and controls

464 lines (349 loc) · 33.1 KB

리눅스 커널에서의 타이머 및 시간 관리.Part 2.

clocksource 프레임워크 소개

이전 파트는 리눅스 커널에서 타이머와 시간 관리에 관련된 것을 설명하는 현재 챕터의 첫 번째 파트였습니다. 우리는 이전 파트에서 두 가지 개념을 알게되었습니다:

  • jiffies
  • clocksource

첫 번째는 include/linux/jiffies.h헤더 파일에서 정의된 전역 변수이며 각 타이머 인터럽트 중 증가되는 카운터를 나타냅니다. 따라서 이 전역 변수에 접근할 수 있고 타이머 인터럽트 속도를 안다면 jiffies를 휴면 타임 유닛으로 변환할 수 있습니다. 우리가 이미 알고 있듯이 타이머 인터럽트 속도는 리눅스 커널에서 HZ라 불리는 컴파일-타임 상수로 표현됩니다. HZ의 값은 CONFIG_HZ커널 구성 옵션의 값과 같고 arch/x86/configs/x86_64_defconfig커널 구성 파일을 보면, 다음을 볼 수 있습니다:

CONFIG_HZ_1000=y

커널 구성 옵션을 설정했습니다. 이것은 CONFIG_HZ의 값이 x86_64아키텍쳐에 대한 디폴트 1000임을 의미합니다. 그래서, jiffies의 값을 HZ의 값으로 나누면:

jiffies / HZ

우리는 리눅스 커널이 작동을 시작한 순간부터 경과한 시간을 얻거나 다른 말로 시스템 업타임을 얻습니다. HZ는 타이머 인터럽트의 양을 초 단위로 나타내므로 앞으로 일정 시간 동안 값을 설정할 수 있습니다. 예시:

/* one minute from now */
unsigned long later = jiffies + 60*HZ;

/* five minutes from now */
unsigned long later = jiffies + 5*60*HZ;

이것은 리눅스 커널에서 매우 일반적인 일입니다. 예를 들어, arch/x86/kernel/smpboot.c소스 코드 파일을 살펴보면, do_boot_cpu함수를 찾을 수 있습니다. 이 함수는 bootstrap프로세서 외에도 모든 프로세서를 부팅합니다. 응용프로그램 프로세서에서 응답을 10초 기다리는 snippet를 찾을 수 있습니다:

if (!boot_error) {
	timeout = jiffies + 10*HZ;
	while (time_before(jiffies, timeout)) {
		...
		...
		...
		udelay(100);
	}
	...
	...
	...
}

여기서 jiffies + 10*HZ값을 timeout변수에 할당합니다. 이미 이해했듯이, 이것은 10초의 시간 초과를 의미합니다. 그런 다음 time_before매크로를 사용하여 현재 jiffies값과 시간초과를 비교하는 루프를 시작합니다.

또는 예를 들어 Ensoniq Soundscape Elite사운드 카드에 대한 드라이버를 나타내는 sound/isa/sscape.c소스 코드 파일을 살펴보면, 그것의 시작 승인 시퀀스를 반환하는 On-Board 프로세에대해 주어진 시간초과를 기다리는 obp_startup_ack함수를 볼 수 있습니다:

static int obp_startup_ack(struct soundscape *s, unsigned timeout)
{
	unsigned long end_time = jiffies + msecs_to_jiffies(timeout);

	do {
		...
		...
		...
		x = host_read_unsafe(s->io_base);
		...
		...
		...
		if (x == 0xfe || x == 0xff)
			return 1;
		msleep(10);
	} while (time_before(jiffies, end_time));

	return 0;
}

볼수 있듯이 jiffies 변수는 Linux kernel code에서 매우 넓게 사용됩니다. 제가 이미 적어놓은 것 처럼 우리는 이전 부분의 관련 개념인 clocksource에 아직 접하지 않았습니다. 우리는 이 개념과 clocksource 등록을 위한 API에 대한 짧은 설명을 봤을 뿐입니다.

보시다시피, jiffies변수는 리눅스 커널 코드에서 매우 널리 사용됩니다. 이미 쓴 것처럼, 우리는 이전 파트의 clocksource와는 다른 새로운 시간 관리와 관련된 개념을 만났습니다. 우리는 이 개념의 간단한 설명과 클럭 소스 등록을 위한 API를 봤습니다. 이 파트에서 자세히 살펴봅시다.

clocksource소개

clocksource개념은 리눅스 커널에서 클럭 소스 관리를 위한 일반 API를 나타냅니다. 이를 위해 별도의 프레임워크가 왜 필요할까요? 처음으로 돌아가봅시다. time개념은 리눅스 커널 및 기타 운영 시스템 커널의 기본 개념입니다. 그리고 timekeeping은 이 개념을 사용하기 위한 필수요소 중 하나입니다. 예를 들어 리눅스 커널은 시스템 시작 이후의 경과 시간을 알고 업데이트해야하며, 현재 프로세스가 모든 프로세서에 대해 얼마나 오래 실행되었는지 결정해야합니다. 리눅스 커널은 어디서 시간에 대한 정보를 얻을까요? 우선 비휘발성 장치로 나타내는 실시간 클럭 또는 RTC입니다. drivers/rtc디텍터리의 리눅스 커널에서 아키텍처 독립적 실시간 클럭 드라이버의 설정을 찾을 수 있습니다. 이외에도, 각 아키텍처는 아키텍처 의존적 실시간 클럭을 제공할 수 있습니다. 예를 들어 x86아키텍처를 위한 CMOS/RTC - arch/x86/kernel/rtc.c가 있습니다. 두 번째는 주기적인 속도로 인터럽트를 자극하는 시스템 타이머입니다. 예를 들어 IBM PC호환 제품의 경우 programmable interval timer가 있습니다.

우리는 이미 timekeeping을 위해 리눅스 커널에서 jiffies를 사용할 수 있다는 것을 압니다. jiffiesHZ주파수로 업데이트된 전역 변수 읽기로 간주될 수 있습니다. 우리는 HZ100에서 1000Hz 범위에 적절한 컴파일시간 커널 매개변수인 것을 알고 있습니다. 따라서 1 - 10밀리초 해상도의 시간 측정을 위한 인터페이스가 보장됩니다. 표준 jiffies 외에, 우리는 거의 1193182헤르츠의 programmable interval timer틱 속도를 기반으로 하는 이전 파트의 refined_jiffies클럭 소스를 봤습니다. 따라서 refined_jiffies1마이크로 초 해상도에 관한 무언가를 얻을 수 있습니다. 이번에는 나노 초로 주어진 클럭 소스의 타임 벨류 유닛을 위한 선호하는 선택을 합니다.

시간 간격 측정을 위한 더 정확한 기술의 가용성은 하드웨어에 따라 다릅니다. 우리는 x86 의존 타이머 하드웨어에 대해 조금 알고 있습니다. 그러나 각 아키텍처는 자체 타이머 하드웨어를 제공합니다. 이전에는 각 아키텍처가 이 목적을 위해 구현되었습니다. 이 문제의 해결책은 다양한 클럭 소스를 관리하고 타이머 인터럽트와 독립적인 공통 코드 프레임워크의 추상 레이어 및 관련 API입니다. 이 공통 코드 프레임워크는 clocksource프레임워크 입니다.

일반적인 timeofday와 클럭 소스 관리 프레임워크는 많은 timekeeping코드를 코드의 아키텍처 독립적인 부분으로 이동시켰으며, 아키텍처 의존적인 부분은 클럭소스의 저수준 하드웨어 부분을 정의하고 관리하는 것으로 축소되었습니다. 다른 하드웨어로 다른 아키텍처마다 시간 간격을 측정하려면 많은 자금이 필요하며 매우 복잡합니다. 서비스와 관련된 각 클럭의 구현은 개별 하드웨어 장치와 밀접하게 연관됐으며, 이해하는 것처럼 다른 아키텍처에서도 비슷한 구현이 발생합니다.

이 프레임워크 내에서, 각 클럭 소스는 단조롭게 증가하는 값으로 시간 표현을 유지해야 합니다. 우리가 리눅스 커널 코드에서 볼 수 있듯이, 나노 초는 이 시점에서 클럭 소스의 타임 벨류 유닛에 대한 가장 선호되는 선택입니다. 클럭 소스 프레임워크의 중요한 점은 사용자가 시스템을 구성하고 선택, 접근 및 다른 클럭 소스를 스케일링할 때 클록 함수를 지원하는 다양한 하드웨어 중에서 클럭 소스를 선택하는 것을 허용하는 것입니다.

클록 소스 구조체

clocksource프레임워크의 기본은 include/linux/clocksource.h헤더파일에 정의된 clocksource구조체입니다. 우리는 이미 이전 파트에서 clocksource구조체가 제공하는 몇 가지 필드를 봤습니다. 이 구조체의 전체 정의을 살펴보고 모든 필드를 설명하겠습니다:

struct clocksource {
	cycle_t (*read)(struct clocksource *cs);
	cycle_t mask;
	u32 mult;
	u32 shift;
	u64 max_idle_ns;
	u32 maxadj;
#ifdef CONFIG_ARCH_CLOCKSOURCE_DATA
	struct arch_clocksource_data archdata;
#endif
	u64 max_cycles;
	const char *name;
	struct list_head list;
	int rating;
	int (*enable)(struct clocksource *cs);
	void (*disable)(struct clocksource *cs);
	unsigned long flags;
	void (*suspend)(struct clocksource *cs);
	void (*resume)(struct clocksource *cs);
#ifdef CONFIG_CLOCKSOURCE_WATCHDOG
	struct list_head wd_list;
	cycle_t cs_last;
	cycle_t wd_last;
#endif
	struct module *owner;
} ____cacheline_aligned;

우리는 이미 이전 파트에서 clocksource구조체의 첫 번째 필드를 봤습니다. 이것은 클럭 소스 프레임워크에서 선택한 최고의 카운터를 반환하는 read함수의 포인터입니다. 예를 들어 jiffies_read함수를 사용해 jiffies값을 읽습니다:

static struct clocksource clocksource_jiffies = {
	...
	.read		= jiffies_read,
	...
}

여기서 jiffies_read을 반환합니다:

static cycle_t jiffies_read(struct clocksource *cs)
{
	return (cycle_t) jiffies;
}

또는 read_tsc함수입니다:

static struct clocksource clocksource_tsc = {
	...
    .read                   = read_tsc,
	...
};

타임 스탬프 카운터를 읽었습니다.

다음 필드는 비64 bit카운터와 카운터 값을 빼는데 특별한 오버플로 논리가 필요하지 않도록 보장해주는 mask입니다. mask필드 다음에 우리는 두 필드 multshifr를 볼 수 있습니다. 이들은 각 클럭 소스에 특정한 타임 벨류를 변환하는 기능을 제공하는 수학 함수의 기초가 되는 필드입니다. 즉, 이 두 필드는 카운터의 추상 기계 타임 유닛을 나노 초로 변환하는데 도움이 됩니다.

이 두 필드 이후에 64비트 max_idle_ns필드는 클럭 소스가 허용하는 최대 대기 시간을 나노 초 단위로 나타냅니다.이 필드에는 CONFIG_NO_HZ커널 구성 옵션이 활성화된 리눅스 커널이 필요합니다. 이 커널 구성 옵션은 정규 타이머 틱(다른 파트에서 모든 설명을 볼 것입니다) 없이 리눅스 커널을 활성화합니다. 문제는 다이나믹 틱이 커널에 싱글 틱보다 긴 시간 동안 절전을 허용하며, 절전 시간에 제한도 없다는 것입니다. max_idle_ns필드는 이 절전 한계를 나타냅니다.

max_idle_ns 다음 필드는 mult의 최대 조정 값인 maxadj필드입니다. 사이클을 나노 초로 변환하는 주요 공식:

((u64) cycles * mult) >> shift;

이것은 100% 정확하진 않습니다. 대신에 숫자는 가능한한 1 나노초에 가까이 나타내고 maxadj는 이것을 수정하는 것을 도와주고 또한 클럭소스 API가 조정될때 오버플로가 발생할 수 있는 mult 값을 피할 수 있도록 해줍니다. 다음 4가지 필드는 함수에 대한 포인터입니다.

100%정확하지는 않습니다. 대신 숫자는 가능한 한 나노 초에 가깝고, maxadj는 이를 수정하는데 도움이 되며, 클럭 소스 API가 조정됐을 때 오버플로 될 수 있는 mult값을 피하게 해줍니다. 다음 4개의 필드는 함수에 대한 포인터입니다:

  • enable - 클럭 소스를 활성화하는 옵션 함수;
  • disable - 클럭 소스를 비활성화하는 옵션 함수;
  • suspend - 클럭 소스에 대한 일시 중단 함수;
  • resume - 클럭 소스에 대한 다시 시작 함수;

다음 필드는 max_cycles로 이름에서 알 수 있듯이, 이 필드는 잠재적 오버플로 이전의 최대 사이클 값을 나타냅니다. 그리고 마지막 필드는 owner로 클럭 소스의 소유자인 커널 모듈에 대한 참조를 나타냅니다. 이것이 전부입니다. 우리는 clocksource구조체의 모든 표준 필드를 살펴보았습니다. 그러나 clocksource 구조체의 일부 필드를 놓친 것을 알 수 있습니다. 누락된 모든 필드는 두 타입으로 나눌 수 있습니다: 첫 번째 타입은 이미 알고 있습니다. 예를 들어, clocksource의 이름을 나타내는 name필드에서, rating필드는 리눅스 커널에이 최상의 클럭 소스 등을 선택하는데 도움이 됩니다. 두 번째 타입은, 다른 리눅스 커널 구성 옵션에 종속적인 필드입니다. 이 필드들을 살펴봅시다.

첫 번째 필드는 archdata입니다. 이 필드는 arch_clocksource_data타입을 가졌으며CONFIG_ARCH_CLOCKSOURCE_DATA 커널 구성 옵션에 따라 다릅니다. 이 필드는 현재 x86IA64에만 해당합니다. 또한 필드 이름에서 알 수 있듯이, 클럭 소스에 대한 아키텍처 특정 데이터를 나타냅니다. 예를 들어, vDSO 클럭 모드를 나타냅니다:

struct arch_clocksource_data {
    int vclock_mode;
};

x86아키텍처를 위합니다. vDSO클럭 모드의 위치는 다음 중 하나가 될 수 있습니다:

#define VCLOCK_NONE 0
#define VCLOCK_TSC  1
#define VCLOCK_HPET 2
#define VCLOCK_PVCLOCK 3

마지막 세 필드는 CONFIG_CLOCKSOURCE_WATCHDOG 커널 구성 옵션에 따르는 wd_list, cs_last, wd_last입니다. 우선 watchdog가 무엇인지 이해해봅시다. 간단히 말하면, watchdog는 컴퓨터 오작동을 감지하고 복구하는데 사용되는 타이머입니다. 이 세 필드는 clocksource프레임워크에서 사용하는 데이터와 관련된 watchdog를 포함합니다. 리눅스 커널 소스 코드를 grep하면 arch/x86/KConfig커널 구성 파일에서만 CONFIG_CLOCKSOURCE_WATCHDOG 커널 구성 옵션을 포함한 것을 볼 수 있습니다. 왜 watchdog에서 x86x86_64이 필요할까요? 당신은 이미 모든 x86프로세서가 특별한 64비트 레지스터 타임 스탬프 카운터를 가진 것을 알 것입니다. 이 레지스터는 리셋 이후의 cycles수를 포함합니다. 때때로 타임 스탬프 카운터는 다른 클럭 소스를 확인해야합니다. 우리는 이 파트에서 watchdog타이머의 초기화는 보지 않을 것입니다. 그 전에 타이머에 대해 더 배워야 합니다.

그것이 전부입니다. 이 순간부터 우리는 clocksource구조체의 모든 필드를 압니다. 이 지식은 clocksource프레임워크 내부를 배우는 것을 도와줄 것입니다.

새로운 클럭 소스 등록

우리는 이전 파트clocksource프레임워크에서 하나의 함수만을 봤습니다. 이 함수는 __clocksource_register입니다. 이 함수는 include/linux/clocksource.h헤더파일에서 정의되었으며 이름에서 알 수 있듯이, 이 함수의 중요한 점은 새로운 클럭 소스를 등록하는 것입니다. __clocksource_register함수의 구현을 살펴보면, __clocksource_register_scale함수의 호출과 그 결과의 반환을 볼 수 있습니다:

static inline int __clocksource_register(struct clocksource *cs)
{
	return __clocksource_register_scale(cs, 1, 0);
}

__clocksource_register_scale함수의 구현을 보기 전에, clocksource에서 새로운 클럭 소스 등록을 위한 추가 API를 제공하는 것을 볼 수 있습니다:

static inline int clocksource_register_hz(struct clocksource *cs, u32 hz)
{
        return __clocksource_register_scale(cs, 1, hz);
}

static inline int clocksource_register_khz(struct clocksource *cs, u32 khz)
{
        return __clocksource_register_scale(cs, 1000, khz);
}

그리고 모든 함수들은 같은 일을 합니다. 그들은 __clocksource_register_scale 함수의 값을 돌려줍니다. 하지만 다른 매개변수 세트를 가지고 있습니다. __clocksource_register_scale 함수는 kernel/time/clocksource.c 소스코드 파일에 정의 되어 있습니다. 두가지 함수의 차이점을 이해하려면 __clocksource_register_khz 함수의 매개변수를 살펴보자. 우리가 볼 수 있듯이 이 함수는 세개의 매개변수를 갖습니다.

그리고 이 모든 함수는 동일합니다. 이들은 __clocksource_register_scale함수의 값을 반환하지만 다른 매개 변수 설정을 사용합니다. __clocksource_register_scalekernel/time/clocksource.c소스 코드 파일에서 정의되었습니다. 함수들 사이의 차이를 이해하기 위해 clocksource_register_khz함수의 매개변수를 살펴봅시다. 보시다시피, 이 함수는 세 개의 매개변수를 가집니다:

  • cs - 설치될 클럭 소스;
  • scale - 클러 소스의 스케일 요소.다시 말해, 이 매개변수의 값을 주파수에 곱하면 클럭 소스의 hz를 얻을 수 있습니다;
  • freq - 클럭 소스 주파수를 스케일로 나눈 값.

이제 __clocksource_register_scale함수의 구현을 살펴봅시다:

int __clocksource_register_scale(struct clocksource *cs, u32 scale, u32 freq)
{
        __clocksource_update_freq_scale(cs, scale, freq);
        mutex_lock(&clocksource_mutex);
        clocksource_enqueue(cs);
        clocksource_enqueue_watchdog(cs);
        clocksource_select();
        mutex_unlock(&clocksource_mutex);
        return 0;
}

우선 __clocksource_register_scale함수가 동일한 소스 코드 파일에서 정의된 __clocksource_update_freq_scale함수에서 시작하고 주어진 클럭 소스를 새로운 주파수로 업데이트 하는 것을 볼 수 있습니다. 이 함수의 구현을 살펴봅시다. 첫 번째 단계ㄹ 우리는 주어진 주파수를 확인하고 0으로 전달되지 않으면, 주어진 클럭 소스에 대한 multshift 매개변수를 계산해야 합니다. 왜 frequency의 값을 확인해야 하는 걸까요? 실제로 이것이 0이 될 수 있기 때문입니다. __clocksource_register함수의 구현을 주의깊게 보면, frequency0으로 전달 되는 것을 눈치 챌 수 있을 것입니다. 우리는 스스로 정의된 multshift매개변수를 가진 일부 클럭 소스에 대해서만 이를 수행할 것입니다. 이전 파트를 보면 jiffies를 위한 multshift의 계산을 볼 수 있습니다. __clocksource_update_freq_scale함수는 다른 클럭 소스를 위한 우리의 클럭 소스를 위해 작동합니다.

따라서 __clocksource_update_freq_scale함수의 시작에서 우리는 frequency매개변수의 값을 확인하고 0이 아니면 주어진 클럭 소스를 위한 multshift를 계산해야합니다. multshift의 계산을 살펴봅시다:

void __clocksource_update_freq_scale(struct clocksource *cs, u32 scale, u32 freq)
{
        u64 sec;

		if (freq) {
             sec = cs->mask;
             do_div(sec, freq);
             do_div(sec, scale);

             if (!sec)
                   sec = 1;
             else if (sec > 600 && cs->mask > UINT_MAX)
                   sec = 600;
 
             clocks_calc_mult_shift(&cs->mult, &cs->shift, freq,
                                    NSEC_PER_SEC / scale, sec * scale);
	    }
	    ...
        ...
        ...
}

여기에서 클럭 소스 카운터가 오버플로 되기 전에 실행할 수 있는 초의 최대 시간을 계산하는 것을 볼 수 있습니다. 우선 sec변수를 클럭 소스 마스크의 값으로 채웁니다. 클럭 소스 마스크가 주어진 클럭 소스에 대해 유효한 비트의 최대량을 나타내는 것을 기억하십시오. 그 다음, 우리는 두 개의 분할 작업을 볼 수 있습니다. 먼저 sec변수를 클럭 소스 주파수와 스케일 요소로 나눕니다. freq매개변수는 1초 동안 얼마나 많은 타이머 인터럽트가 발생하는지 보여줍니다. 따라서, 우리는 타이머의 주파수로 카운터(예시 jiffy)의 최대 번호를 나타내는 mask값을 나누고 특정 클럭 소스에 대한 최대 시간(초)을 얻습니다. 두 번째 나눗셈 연산은 1헤르츠 또는 1킬로헤르츠(10^3 Hz)의 스케일 요소에 따라 특정 클럭 소스를 위한 최대 시간(초)을 줍니다.

최대 시간(초)을 얻은 다음, 우리는 이 값을 확인하고 다음 단계의 결과에 따라 1 또는 600으로 설정합니다. 이 값들은 초 단위의 클럭 소스를 위한 최대 대기 시간입니다. 다음 단계에서 우리는 clocks_calc_mult_shift의 호출을 볼 수 있습니다. 이 함수의 중요한 점은 주어진 클럭 소스를 위한 multshift 값의 계산입니다. __clocksource_update_freq_scale함수의 끝에서 우리는 주어진 클럭 소스의 계산된 mult값이 조정 후 오버플로를 유발하지 않는지 확인하고 주어진 클럭 소스의 값 max_idle_nsmax_cycles를 클럭 소스 카운터로 변환될 수 있는 최대 나노 초로 업데이트 하고 결과를 커널 버퍼로 출력합니다:

pr_info("%s: mask: 0x%llx max_cycles: 0x%llx, max_idle_ns: %lld ns\n",
	cs->name, cs->mask, cs->max_cycles, cs->max_idle_ns);

dmesg출력에서 볼 수 있습니다:

$ dmesg | grep "clocksource:"
[    0.000000] clocksource: refined-jiffies: mask: 0xffffffff max_cycles: 0xffffffff, max_idle_ns: 1910969940391419 ns
[    0.000000] clocksource: hpet: mask: 0xffffffff max_cycles: 0xffffffff, max_idle_ns: 133484882848 ns
[    0.094084] clocksource: jiffies: mask: 0xffffffff max_cycles: 0xffffffff, max_idle_ns: 1911260446275000 ns
[    0.205302] clocksource: acpi_pm: mask: 0xffffff max_cycles: 0xffffff, max_idle_ns: 2085701024 ns
[    1.452979] clocksource: tsc: mask: 0xffffffffffffffff max_cycles: 0x7350b459580, max_idle_ns: 881591204237 ns

__clocksource_update_freq_scale함수가 작업을 완료한 다음, 새로운 클럭 소스를 등록하는 __clocksource_register_scale함수로 돌아갈 수 있습니다. 다음 세 함수의 호출을 볼 수 있습니다:

mutex_lock(&clocksource_mutex);
clocksource_enqueue(cs);
clocksource_enqueue_watchdog(cs);
clocksource_select();
mutex_unlock(&clocksource_mutex);

첫 번째 함수가 호출되기 전에, clocksource_mutex뮤텍스를 잠그십시오. clocksource_mutex뮤텍스의 요점은 현재 선택된 clocksource와 등록된 clocksources를 포함한 리스트를 나타내는 clocksource_list를 나타내는 curr_clocksource 변수를 보호하는 것입니다. 이제, 이 세 개의 함수를 살펴봅시다.

첫 번째 clocksource_enqueue함수와 다른 두 함수는 동일한 소스 코드 파일에 정의되어있습니다. 우리는 이미 등록된 clocksources의 모든 과정을 거칩니다. 다시 말해 우리는 clocksource_list의 모든 요소를 거치며 주어진 clocksource에 가장 적합한 장소를 찾으려합니다:

static void clocksource_enqueue(struct clocksource *cs)
{
	struct list_head *entry = &clocksource_list;
	struct clocksource *tmp;

	list_for_each_entry(tmp, &clocksource_list, list)
		if (tmp->rating >= cs->rating)
			entry = &tmp->list;
	list_add(&cs->list, entry);
}

결국 우리는 새로운 클럭소스를 clocksource_list에 삽입합니다. 두 번째 함수 clocksource_enqueue_watchdog는 이전 함수와 거의 같지만 새로운 클럭 소스를 클럭 소스의 플래그에 의존하는 wd_list에 삽입하고 새로운 watchdog타이머를 시작합니다. 따라서 이미 쓴 것처럼, 우리는 이 파트에서 관련된 watchdog를 고려하지 않아도 되지만 다음 파트에서 다룰 것입니다.

마지막 함수는 clocksource_select입니다. 함수 이름에서 이해할 수 있듯이, 이 함수의 중요한 점은 등록된 클럭소스에서 최고의 clocksource를 선택하는 것입니다. 이 함수는 함수 도우미의 호출로만 구성됩니다:

static void clocksource_select(void)
{
	return __clocksource_select(false);
}

__clocksource_select함수는 하나의 매개변수(우리의 경우 false)를 가집니다. 이 bool매개변수는 clocksource_list가 어떻게 가로지르는지 보여줍니다. 우리의 경우 clocksource_list의 모든 엔트리를 거치는 것을 의미하는 false를 전달합니다. 우리는 이미 clocksource_enqueue함수의 호출 다음 첫 번째 clocksource_list가 가장 높은 등급의 clocksource인 것을 알기 때문에 목록에서 쉽게 얻을 수 있습니다. 최고 등급의 클럭 소스를 찾은 다음 다음으로 전환합니다:

if (curr_clocksource != best && !timekeeping_notify(best)) {
	pr_info("Switched to clocksource %s\n", best->name);
	curr_clocksource = best;
}

이 작업의 결과는 dmesg출력에서 볼 수 있습니다:

$ dmesg | grep Switched
[    0.199688] clocksource: Switched to clocksource hpet
[    2.452966] clocksource: Switched to clocksource tsc

dmesg출력(우리의 경우 hpettsc)에서 두 클럭 소스를 볼 수 있습니다. 예, 실제로 특정 하드웨어에는 다양한 클럭 소스가 있을 수 있습니다. 따라서 리눅스 커널은 등록된 모든 클럭 소스를 알며 새로운 클럭 소스를 등록한 다음 매번 더 좋은 등급의 클럭 소스로 전환합니다.

kernel/time/clocksource.c소스 코드 파일의 맨 아래를 보면, sysfs인터페이스를 볼 수 있습니다. initcalls장치가 호출되는 동안 init_clocksource_sysfs함수에서 기본 초기화가 일어납니다.init_clocksource_sysfs함수의 구현을 봅시다:

static struct bus_type clocksource_subsys = {
	.name = "clocksource",
	.dev_name = "clocksource",
};

static int __init init_clocksource_sysfs(void)
{
	int error = subsys_system_register(&clocksource_subsys, NULL);

	if (!error)
		error = device_register(&device_clocksource);
	if (!error)
		error = device_create_file(
				&device_clocksource,
				&dev_attr_current_clocksource);
	if (!error)
		error = device_create_file(&device_clocksource,
					   &dev_attr_unbind_clocksource);
	if (!error)
		error = device_create_file(
				&device_clocksource,
				&dev_attr_available_clocksource);
	return error;
}
device_initcall(init_clocksource_sysfs);

우선 subsys_system_register함수의 호출로 clocksource서브시스템을 등록하는 것을 볼 수 있습니다. 다시 말해, 함수의 호출 이후 다음 디렉토리를 갖게 됩니다:

$ pwd
/sys/devices/system/clocksource

이 단계 후에, 다음 구조체로 나타내지는 device_clocksource장치의 등록을 볼 수 있습니다:

static struct device device_clocksource = {
	.id	= 0,
	.bus	= &clocksource_subsys,
};

그리고 세 개의 파일을 생성합니다:

  • dev_attr_current_clocksource;
  • dev_attr_unbind_clocksource;
  • dev_attr_available_clocksource.

이 파일들은 시스템의 현재 클럭 소스, 시스템에서 사용가능한 클럭 소스, 클럭 소스의 언바인드를 허용하는 인터페이스에 관한 정보를 제공합니다.

init_clocksource_sysfs함수가 실행된 다음, 다음에서 사용가능한 클럭 소스에 관한 일부 정보를 찾을 수 있습니다:

$ cat /sys/devices/system/clocksource/clocksource0/available_clocksource 
tsc hpet acpi_pm 

또는 현재 클럭 소스에 대한 정보는 다음과 같습니다:

$ cat /sys/devices/system/clocksource/clocksource0/current_clocksource 
tsc

이전 파트에서는, jiffies클럭 소스 등록을 위한 API을 봤지만 clocksource프레임워크에 관한 자세한 내용은 다루지 않았습니다. 이 파트에서 우리는 새로운 클럭 소스 등록을 구현하고 시스템에서 최고의 등급 값을 가진 클럭 소스를 선택하는 것을 봤습니다. 물론, 이것은 clocksource 프레임워크가 제공하는 모든 API가 아닙니다. clocksource_list 등에서 주어진 클럭 소스를 제거하기 위한 clocksource_unregister 같은 몇 가지 추가 함수가 있습니다. 그러나 이 함수는 현재 우리에게 중요하지 않으므로 이 파트에서는 설명하지 않겠습니다. 어쨌거나 흥미가 있으면, kernel/time/clocksource.c에서 찾아볼 수 있습니다.

그것이 전부입니다.

결론

이것은 리눅스 커널에서 타이머 및 시간 관리에 관해 설명하는 챕터의 두 번째 파트의 끝입니다. 이전 파트에서는 다음과 같은 두 개념: jiffiesclocksource와 접했습니다. 이 파트에서 우리는 jiffies사용법의 몇 가지 예시를 봤고 더 자세한 clocksource 개념을 알았습니다.

질문이나 제안 사항이 있다면, 트위터 0xAX로 자유롭게 보내거나 제 이메일에 넣거나 이슈를 만들어 주세요.

영어는 모국어가 아니어서 모든 불편한 점은 정말 죄송합니다. 실수를 발견하면 저에게 linux-insides로 PR을 보내주십시오.

링크