Skip to content

Latest commit

 

History

History
389 lines (289 loc) · 19.6 KB

user_defined_literals.md

File metadata and controls

389 lines (289 loc) · 19.6 KB

ユーザー定義リテラル [N2765]

  • cpp11[meta cpp]

このページはC++11に採用された言語機能の変更を解説しています。

のちのC++規格でさらに変更される場合があるため関連項目を参照してください。

概要

ユーザー定義リテラル(User-defined literals)は、1233.14"hello"といったリテラルに対して付けられるサフィックスをオーバーロードできるようにすることで、ユーザーがリテラルに意味を持たせられるようにする機能である。

これは、リテラルに対して以下のような情報を持たせるために使用できる:

  • 単位 : メートル、秒、角度として度数法か弧度法、など
  • 型 : "hello"sとすることでstd::string型の文字列リテラル、1.2iとすることでstd::complex<double>型のリテラルとするなど

ユーザー定義リテラルは、operator"" サフィックス名の演算子をオーバーロードする。""とサフィックス名の間にスペースが必要なので注意(C++14 では空白は必須では無くなった。リテラル演算子のスペースを省略可能とする参照)。

std::string operator"" s(const char* str, std::size_t length)
{
  return std::string(str, length);
}

auto x = "hello"s; // xの型はstd::string

operator"" サフィックス名は、「リテラル演算子 (literal operator)」という。

ユーザー定義リテラルは、以下の 4 種類が使用できる。

  • 整数リテラル
  • 浮動小数点リテラル
  • 文字列リテラル(通常の文字列、ワイド文字列、char16_t 文字列、char32_t 文字列)
  • 文字リテラル(通常の文字、ワイド文字、char16_t 文字、char32_t 文字)

仕様

全般的な仕様

  • あるトークンがユーザー定義リテラルと通常のリテラルの両方に解釈可能な場合は、通常のリテラルとみなされる。 例えば、100E2 は、通常の浮動小数点リテラル 100.0E+2 と考える事も、整数リテラル 100 にサフィックス E2 の付いたユーザー定義整数リテラルと考えることもできるが、その場合には浮動小数点リテラルとみなされる。

  • リテラル演算子のサフィックス名として、ユニバーサルキャラクタ名を使用することができる。

    namespace literals {
      // _ + ギリシャ文字の小文字の pi
      float operator"" _\u03C0(unsigned long long count)
      {
        return 3.141592f * count;
      }
    }
    
    using namespace literals;
    
    float x = 2_\u03C0; // OK
    float y = 2_π;     // OK(ただし、π がソースファイル文字として許されている場合のみ)
  • 論理値型に対しては、リテラル演算子を定義できない

  • リテラル演算子とリテラル演算子テンプレートは、Cリンケージを持ってはならない

  • リテラル演算子とリテラル演算子テンプレートは、inlineconstexprを付けて宣言できる

  • リテラル演算子とリテラル演算子テンプレートは、内部リンケージもしくは外部リンケージを持つ可能性がある

  • リテラル演算子がデフォルト引数を持つ場合、プログラムは不適格となる

整数に対するリテラル演算子

整数に対するリテラル演算子は、以下のいずれかとなる。

  1. unsigned long long 型のパラメータをひとつだけ持つリテラル演算子

    戻り値型 operator"" サフィックス名(unsigned long long 整数リテラル);

    ここで、整数リテラル にはユーザー定義リテラルのサフィックス名を削除した部分が unsigned long long 型で渡される。

  2. const char* 型のパラメータをひとつだけ持つリテラル演算子

    戻り値型 operator"" サフィックス名(const char* 整数リテラル);

    ここで、整数リテラル にはユーザー定義リテラルのサフィックス名を削除した部分が const char* 型('\0' で終端された C 文字列)で渡される。

  3. char 型のテンプレートパラメータパックを一つだけ持ち、パラメータの無いリテラル演算子テンプレート

    template <char... 整数リテラル>
    戻り値型 operator"" サフィックス名();

    ここで、整数リテラル にはユーザー定義リテラルのサフィックス名を削除した部分の各文字が char 型のテンプレートパラメータパックで渡される。

これらが複数見つかった場合、1 があれば 1 が、1 が無ければ 2 か 3 が使用される。1 が無く 2 と 3 の両方があった場合にはプログラムは不適格となる。
1 は引数が unsigned long long であるため、リテラル部分が unsigned long long を超えたユーザリテラルを使用する事はできないが、2 と 3 の形式の場合はリテラル部分が文字列として引き渡されるため、unsigned long long の範囲を超えたユーザー定義リテラルを使用する事が可能となる。
なお、1 は整数リテラルにしか使用する事ができないが、2 と 3 は浮動小数点リテラルに対しても使用する事ができてしまうため、注意が必要である。
(引数として渡された文字列が整数リテラルであるという仮定をしないでリテラル演算子を定義したほうが良いだろう)

namespace unit_literals {
  // intの大きさを持ち、km (kiro-meter, キロメートル)単位を表すリテラル演算子
  // 上記 1 のバージョン
  int operator"" _kmi(unsigned long long x)
  {
    return x * 1000;
  }

  // 上記 2 のバージョン
  int operator"" _kmj(const char* s)
  {
    return std::strtoull(s, nullptr, 10) * 1000;
  }

  // 上記 3 のバージョン
  template<char... S>
  int operator"" _kmk()
  {
    using CSTR = const char[];
    return operator"" _kmj(CSTR{ S..., '\0' });
  }
}

using namespace unit_literals;

// 123km (123,000m)
int distance1 = 123_kmi;
// 456km (456,000m)
int distance2 = 456_kmj;
// 789km (789,000m)
int distance3 = 789_kmk;

整数リテラルの前にマイナス記号(-)を付けて記述した場合でも、リテラル演算子には正数部分のみが渡される(通常の数値と同様、マイナス記号はリテラルの一部とはみなされない)。
マイナス記号は、リテラル演算子によって返された値に対して単項マイナス演算子として適用される。

// _kmiリテラル演算子に渡されるのは整数値123LL
int minus_distance = -123_kmi;

浮動小数点数に対するリテラル演算子

浮動小数点数に対するリテラル演算子は、以下のいずれかとなる。

  1. long double 型のパラメータをひとつだけ持つリテラル演算子

    戻り値型 operator"" サフィックス名(long double 浮動小数点リテラル);

    ここで、浮動小数点リテラル にはユーザー定義リテラルのサフィックス名を削除した部分が long double 型で渡される。

  2. const char* 型のパラメータをひとつだけ持つリテラル演算子

    戻り値型 operator"" サフィックス名(const char* 浮動小数点リテラル);

    ここで、浮動小数点リテラル にはユーザー定義リテラルのサフィックス名を削除した部分が const char* 型('\0' で終端された C 文字列)で渡される。

  3. char 型のテンプレートパラメータパックを一つだけ持ち、パラメータの無いリテラル演算子テンプレート

    template <char... 浮動小数点リテラル>
    戻り値型 operator"" サフィックス名();

    ここで、浮動小数点リテラル にはユーザー定義リテラルのサフィックス名を削除した部分の各文字が char 型のテンプレートパラメータパックで渡される。

これらが複数見つかった場合、1 があれば 1 が、1 が無ければ 2 か 3 が使用される。1 が無く 2 と 3 の両方があった場合にはプログラムは不適格となる。 1 は引数が long double であるため、リテラル部分が long double を超えたユーザリテラルを使用する事はできないが、2 と 3 の形式の場合はリテラル部分が文字列として引き渡されるため、long double の範囲を超えたユーザー定義リテラルを使用する事が可能となる。
なお、1 は浮動小数点リテラルにしか使用する事ができないが、2 と 3 は整数リテラルに対しても使用する事ができてしまうため、注意が必要である。
(引数として渡された文字列が浮動小数点リテラルであるという仮定をしないでリテラル演算子を定義したほうが良いだろう)

namespace unit_literals {
  // floatの大きさを持ち、km (kiro-meter, キロメートル)単位を表すリテラル演算子
  // 上記 1 のバージョン
  float operator"" _kmf(long double x)
  {
    return x * 1000.0f;
  }

  // 上記 2 のバージョン
  float operator"" _kmg(const char* s)
  {
    return std::stold(s, nullptr) * 1000.0f;
  }

  // 上記 3 のバージョン
  template<char... S>
  float operator"" _kmh()
  {
    using CSTR = const char[];
    return operator"" _kmg(CSTR{ S..., '\0' });
  }
}

using namespace unit_literals;

// 123km (123,000m)
float distance1 = 123.0_kmf;
// 456km (456,000m)
float distance2 = 456.0_kmg;
// 789km (789,000m)
float distance3 = 789.0_kmh;
  • std::stold[link /reference/string/stold.md]

浮動小数点リテラルの前にマイナス記号(-)を付けて記述した場合でも、リテラル演算子には正数部分のみが渡される(通常の数値と同様、マイナス記号はリテラルの一部とはみなされない)。
マイナス記号は、リテラル演算子によって返された値に対して単項マイナス演算子として適用される。

// _kmfリテラル演算子に渡されるのは浮動小数点数の値123.0L
float minus_distance = -123.0_kmf;

文字列に対するリテラル演算子

文字列に対するリテラル演算子は、文字列リテラルの型によって以下のいずれかとなる。

// 通常の文字列リテラルの場合
戻り値型 operator"" サフィックス名(const char* 文字列リテラル, std::size_t 文字列リテラル長);

// ワイド文字列リテラルの場合
戻り値型 operator"" サフィックス名(const wchar_t* 文字列リテラル, std::size_t 文字列リテラル長);

// char16_t 文字列リテラルの場合
戻り値型 operator"" サフィックス名(const char16_t* 文字列リテラル, std::size_t 文字列リテラル長);

// char32_t 文字列リテラルの場合
戻り値型 operator"" サフィックス名(const char32_t* 文字列リテラル, std::size_t 文字列リテラル長);

ここで、文字列リテラル にはユーザー定義リテラルのサフィックス名を削除した文字列部分の先頭を指すポインタが、文字列リテラル長 には当該文字列の長さが渡される。
なお、文字列リテラル長 には終端文字(ヌル文字)は含まれない。

namespace literals {
  std::u32string operator"" _s(const char32_t* str, std::size_t length)
  {
    return std::u32string(str, length);
  }
}

using namespace literals;
auto str = UR"(こんにちは"世界")"_s;
assert(str.size() == 9);
  • str.size()[link /reference/string/basic_string/size.md]

文字に対するリテラル演算子

文字に対するリテラル演算子は、文字リテラルの型によって以下のいずれかとなる。

// 通常の文字リテラルの場合
戻り値型 operator"" サフィックス名(char 文字リテラル);

// ワイド文字リテラルの場合
戻り値型 operator"" サフィックス名(wchar_t 文字リテラル);

// char16_t 文字リテラルの場合
戻り値型 operator"" サフィックス名(char16_t 文字リテラル);

// char32_t 文字リテラルの場合
戻り値型 operator"" サフィックス名(char32_t 文字リテラル);

ユーザー定義文字列リテラルの結合

通常の文字列リテラルと同様、隣接したユーザー定義文字列リテラルはプリプロセス時に結合される。
結合は、サフィックス名を無視して通常の文字列リテラルとして行われ、リテラル演算子は結合後の文字列に対して呼び出される。
なお、結合前の各ユーザー定義文字列リテラルのサフィックス名は一致していなければならない。
しかし、ユーザ定義文字列リテラルと通常の文字列リテラルは結合可能である。その場合、結合後の文字列リテラルはユーザ定義文字列リテラルとなる。

std::string operator"" _s(const char* s, std::size_t l)
{
  return { s, l };
}

std::u32string operator"" _t(const char32_t* s, std::size_t l)
{
  return { s, l };
}

auto s1 = "hello, "_s "world"_s;            // operator"" _s は いずれのケースでも
auto s2 = "hello, "_s "world"  ;            // "hello, world" に対して
auto s3 = "hello, "   "world"_s;            // 1 度だけ呼び出される。

auto t1 = U"Bjarne "_t U"Stroustrup"_t;     // operator"" _t はいずれのケースでも
auto t2 =  "Bjarne "_t U"Stroustrup"  ;     // U"Bjarne Stroustrup" に対して
auto t3 = U"Bjarne "_t  "Stroustrup"  ;     // 1 度だけ呼び出される。
auto t4 =  "Bjarne "   U"Stroustrup"_t;

//auto u = "hello, "_s "Bjarne"_t;          // サフィックス名が異なるためエラー

サフィックス名の規約

アンダースコアで始まらないユーザー定義リテラルのサフィックス名は、標準C++の将来の拡張のために予約されている。
このため、ユーザー定義リテラルを定義する場合、サフィックス名はアンダースコア _ で始める必要がある。
なお、アンダースコア+大文字で始まる識別子、および、連続した 2 つ以上のアンダースコアを含む識別子は、ユーザー定義リテラルのサフィックス名に限らず標準C++の規約で予約されているため、注意が必要である。

#include <iostream>
#include <string>

namespace my_namespace {
inline namespace literals {
  std::string operator"" _s(const char* str, std::size_t length)
  {
    return std::string(str, length);
  }
}}

int main()
{
  using namespace my_namespace::literals;

  auto x = "hello"_s; // xの型はstd::string
  std::cout << x << std::endl;
}

出力

hello

この機能が必要になった背景・経緯

ユーザー定義リテラルが最初に提案された際の動機は、「complex<double>(1.1, 1.2)のようなコンストラクタ呼び出しがあった場合に、それを組み込み型のリテラルと同様にコンパイル時定数としたい」というものだった。この問題に対する解決はconstexpr機能によって行われたが、ユーザー定義型のためのリテラルを定義できるようにする提案は、動機を変えて残った。

ユーザー定義型に関して、C++には基本的な設計原則がある:

  1. ユーザー定義型は、組み込み型と同じ設備(facilities)をサポートできること。C++03では、組み込み型がもつ「リテラル」という機能を、ユーザー定義型に持たせることができなかった
  2. C言語との互換性を維持する必要があるが、C99が持つ複素数リテラルを受け入れるための機能がない

ユーザー定義型に対してリテラルを定義できるようにすることで、ユーザー定義型で可能な設計の範囲が増え、C言語が持つ複素数リテラルをC++の機能のなかで実現できるようになる。

検討されたほかの選択肢

ユーザー定義型に対するリテラルのサポートをする方法は、いくつか段階的に提案された。

まず、リテラルのための特殊なコンストラクタを用意する案:

class DecimalFloat {
public:
  DecimalFloat(const char* literalString, double "df", "DF") { … }
};

DecimalFloat f = 12.34df;

この案では、先頭のパラメータliteralString12.34のようなリテラルの値が文字列として代入され、リテラルに入力される文字をdoubleに属する値に限定し、サフィックスとして使用できる文字列として"df""DF"を許可する、というような形式となっていた。

その後の案では、コンストラクタではなく演算子をオーバーロードする形式となった。当時はDecimalFloat operator"df"(const char*)のように、サフィックスの名称をダブルクォーテーション内に書くようになっていた。

リテラル名がサフィックスであることを明示的にするために、今日のDecimalFloat operator"" df(long double)という形式になった。

参照