it-swarm-ru.tech

Что обычно лучше всего использовать - StringComparison.OrdinalIgnoreCase или StringComparison.InvariantCultureIgnoreCase?

У меня есть такой код:

If key.Equals("search", StringComparison.OrdinalIgnoreCase) Then
    DoSomething()
End If

Меня не волнует дело. Должен ли я использовать OrdinalIgnoreCase, InvariantCultureIgnoreCase или CurrentCultureIgnoreCase?

139
Dave Haynes

Более новые .Net Docs теперь имеют таблицу, которая поможет вам решить, что лучше всего использовать в вашей ситуации.

Из MSDN " Новые рекомендации по использованию строк в Microsoft .NET 2. "

Сводка. Владельцам кода, ранее использующим InvariantCulture для сравнения строк, сортировки и сортировки, следует строго рассмотреть возможность использования нового набора перегрузок String в Microsoft .NET 2.0. В частности, данные, предназначенные для не зависящих от культуры и лингвистически не относящихся , должны начинать указывать перегрузки, используя члены StringComparison.Ordinal или StringComparison.OrdinalIgnoreCase нового перечисления StringComparison. Они обеспечивают побайтовое сравнение, подобное strcmp, которое не только устраняет ошибки в лингвистической интерпретации по существу символьных строк, но и обеспечивает лучшую производительность.

151
Robert Taylor

Все это зависит

Сравнивать юникодные строки сложно:

Реализация поиска и сравнения строк Unicode в программном обеспечении для обработки текста должна учитывать наличие эквивалентных кодовых точек. В отсутствие этой функции пользователи, ищущие определенную последовательность кодовых точек, не смогут найти другие визуально неразличимые глифы, которые имеют другое, но канонически эквивалентное представление кодовых точек.

см .: http://en.wikipedia.org/wiki/Unicode_equivalence


Если вы пытаетесь сравнить 2 строки Юникода без учета регистра и хотите, чтобы оно работало ВЕЗДЕ, у вас возникла проблема.

Классическим примером является Turkish i , который в верхнем регистре становится İ (обратите внимание на точку)

По умолчанию .NET Framework обычно использует CurrentCulture для функций, связанных со строками, с очень важным исключением из .Equals, который использует порядковое (побайтное) сравнение.

Это приводит к тому, что различные строковые функции ведут себя по-разному в зависимости от культуры компьютера.


Тем не менее, иногда мы хотим "общего назначения", без учета регистра, сравнения.

Например, вы можете захотеть, чтобы сравнение строк велось одинаково, независимо от того, на каком компьютере установлено приложение.

Для этого у нас есть 3 варианта:

  1. Установите явную культуру и выполните сравнение без учета регистра, используя правила эквивалентности Юникода.
  2. Установите для культуры значение Инвариантная культура и выполняйте сравнение без учета регистра, используя правила эквивалентности Юникода.
  3. Используйте OrdinalIgnoreCase , который будет вводить строку в верхнем регистре с использованием InvariantCulture, а затем выполнять побайтовое сравнение.

Правила эквивалентности Юникода сложны, что означает, что использование метода 1) или 2) более затратно, чем OrdinalIgnoreCase. Тот факт, что OrdinalIgnoreCase не выполняет какой-либо специальной нормализации Юникода, означает, что некоторые строки, которые одинаково отображаются на экране компьютера, не будут считаться идентичными. Например: "\u0061\u030a" и "\u00e5" оба отображают å. Однако в порядковом сравнении будет считаться другим.

То, что вы выбираете, во многом зависит от приложения, которое вы создаете.

  • Если бы я писал бизнес-приложение, которое использовалось только турецкими пользователями, я бы обязательно использовал метод 1.
  • Если бы мне просто нужно было "поддельное" сравнение без учета регистра, например, имя столбца в БД, которое обычно является английским, я бы, вероятно, использовал метод 3.

У Microsoft есть их набор рекомендаций с четкими рекомендациями. Тем не менее, очень важно понять понятие эквивалентности Юникода, прежде чем подходить к этим проблемам.

Кроме того, имейте в виду, что OrdinalIgnoreCase является очень особенным видом зверя, который выбирает и выбирает немного порядкового сравнения с некоторыми смешанными в лексикографических аспектах. Это может сбивать с толку.

56
Sam Saffron

MSDN дает довольно четкие рекомендации по этому поводу: http://msdn.Microsoft.com/en-us/library/ms973919.aspx

8
chessguy

Я думаю, это зависит от вашей ситуации. Поскольку порядковые сравнения на самом деле смотрят на числовые значения Unicode символов, они не будут лучшим выбором при сортировке по алфавиту. Однако для сравнения строк порядковый номер будет чуть быстрее.

3
Bullines

Это зависит от того, что вы хотите, хотя я бы уклонялся от инвариантной культуры, если вы не очень уверены, что никогда не захотите локализовать код для других языки. Вместо этого используйте CurrentCulture.

Кроме того, OrdinalIgnoreCase должен учитывать числа, которые могут или не могут быть тем, что вы хотите.

1
Joel Coehoorn

Очень простой ответ: если вы не используете турецкий язык, вам не нужно использовать InvariantCulture.

Смотрите следующую ссылку:

В C # в чем разница между ToUpper () и ToUpperInvariant ()?

0
TheMoot