Сортировка списков в python: list.sort() против sorted(list)
Содержание:
- Содержание справочника по Python3:
- Случайная сортировка
- sorted() With a key Argument
- Предварительное использование key в функции сортировки
- Key Functions¶
- Пирамидальная сортировка
- Python NumPy
- The Old Way Using the cmp Parameter
- Скорость сортировки в Python
- Простая сортировка
- Что такое списки?
- Прочее
- Обработка текста в NumPy на примерах
- Python NumPy
- Sort Stability and Complex Sorts
- Стабильность сортировки и сложные сортировки
- The Old Way Using the cmp Parameter¶
- Встроенные функции сортировки на Python
- Odd and Ends¶
Содержание справочника по Python3:
Определение функций в Python.
Ключевое слово def вводит определение функции . За ним должно следовать имя функции и заключенный в скобки список формальных параметров. Операторы, которые формируют тело функции, начинаются со следующей строки и должны иметь отступ.
Приоритет операций в выражениях в Python.
Выражение — это код, который интерпретатор Python вычисляет для получения значения. Операции с более высоким приоритетом выполняются до выполнения операций с более низким приоритетом.
Строковые и байтовые литералы.
Байтовые литералы всегда начинаются с префикса ‘b’ или ‘B’. Как строковые, так и байтовые литералы могут дополнительно иметь префикс в виде буквы ‘r’ или ‘R’. Такие строки называются необработанными.
Встроенные константы языка Python.
Пространство имен языка Python имеет небольшое количество встроенных констант. Это False, True, None, NotImplemented, __debug__
Инструкция del в Python.
Инструкция `del` не удаляет объекты в буквальном смысле, она лишь открепляет ссылки, разрывая связь между именем и объектом. Удаление объекта произойдет как следствие работы сборщика мусора.
Приемы работы со строками в Python.
Язык программирования Python может манипулировать строками, которые могут быть записаны несколькими способами. Текстовые строки могут быть заключены в одинарные кавычки (‘…’) или двойные кавычки («…»), что в результате будет одно и то же.
Использование регулярных выражений в Python.
Регулярные выражения — это шаблоны соответствия текста, описанные в формальном синтаксисе и могут включать в себя буквальное сопоставление текста, повторение, ветвление и другие сложные правила. Регулярные выражения обычно используются в приложениях, которые требуют тонкую обработку текста.
Использование списков list в Python.
Язык программирования Python имеет несколько составных типов данных, используемых для группировки значений. Наиболее универсальным является список, который можно записать в виде списка значений (элементов), разделенных запятыми, в квадратных скобках.
Использование кортежей tuple в Python.
Кортежи являются неизменяемыми и обычно содержат гетерогенную последовательность элементов, доступ к которым осуществляется через распаковку или индексацию, или даже по атрибуту в случае `collections.namedtuple()`.
Использование словарей dict в Python.
Основные использование словаря — это хранение значения с некоторым ключом и извлечение значения из словаря, заданного ключом. Лучше всего рассматривать словарь как набор пар «ключ-значение» с требованием, чтобы ключи были уникальными в пределах одног
Использование множеств set в Python.
Основные виды использования множеств включают вхождение/наличие элемента и устранение дубликатов записей.
Итераторы в Python.
Функция возвращает объект итератора, который определяет метод __next__(), который, в свою очередь обращается к элементам в контейнере по одному за раз. Когда нет больше элементов, __next__() возбуждает исключение StopIteration
Функция генератора в Python.
Генераторы используют оператор yield всякий раз, когда они хотят вернуть данные. Каждый раз, когда вызывается встроенная функция next(), генератор возобновляет работу с того места, где он остановился.
Работа с файлами в Python.
При доступе к файлу в операционной системе требуется указать путь к файлу. Путь к файлу — это строка, которая представляет местоположение файла.
Система импорта в Python.
При первом импорте модуля Python выполняет поиск модуля и, если он найден, создает объект модуля, инициализируя его. Если именованный модуль не может быть найден, то вызывается исключение ModuleNotFoundError.
Случайная сортировка
Ключи не обязаны иметь какую-либо связь с сортируемыми элементами (однако, это не самый продуктивный способ сортировать что-либо). Мы можем создать случайный порядок со следующим ключом:
Функция random() – это часть стандартной библиотеки random, которая выдает числа в случайном порядке от 0 до 1. Сортировка с использованием данного ключа выдает, кто бы мог подумать, случайный порядок:
В данной статье мы рассмотрели то, как Python создает отсортированные списки (и другие итерируемые) и то, насколько это просто. По умолчанию, функция sorted() возвращает список, содержимое которого упорядоченно в естественном порядке (что, в общем, именно то что мы ожидаем от чисел и строк). Желающие углубиться в то, как работает функция sorted() могут обратиться к документации Python.
Мы также научились определять наш собственный порядок сортировки, передавая функцию key функции sorted(). Наши ключевые функции могут возвращать любое значение, какое нам угодно, но зачастую нам, скорее всего, понадобится отсортировать атрибут, который принадлежит каждому элементу списка. Фактически, эта ситуация возникает настолько часто, что Python поместили функцию operator.getattr() в стандартную библиотеку, которая может генерировать ключевые функции этого типа для нас.
sorted() With a key Argument
One of the most powerful components of is the keyword argument called . This argument expects a function to be passed to it, and that function will be used on each value in the list being sorted to determine the resulting order.
To demonstrate a basic example, let’s assume the requirement for ordering a specific list is the length of the strings in the list, shortest to longest. The function to return the length of a string, , will be used with the argument:
>>>
The resulting order is a list with a string order of shortest to longest. The length of each element in the list is determined by and then returned in ascending order.
Let’s return to the earlier example of sorting by first letter when the case is different. can be used to solve that problem by converting the entire string to lowercase:
>>>
The output values have not been converted to lowercase because does not manipulate the data in the original list. During sorting, the function passed to is being called on each element to determine sort order, but the original values will be in the output.
There are two main limitations when you’re using functions with the argument.
First, the number of required arguments in the function passed to must be one.
The example below shows the definition of an addition function that takes two arguments. When that function is used in on a list of numbers, it fails because it is missing a second argument. Each time is called during the sort, it is only receiving one element from the list at a time:
>>>
The second limitation is that the function used with must be able to handle all the values in the iterable. For example, you have a list of numbers represented as strings to be used in , and is going to attempt to convert them to numbers using . If a value in the iterable can’t be cast to an integer, then the function will fail:
>>>
Each numeric value as a can be converted to , but can’t. This causes a to be raised and explain that can’t be converted to because it is invalid.
The functionality is extremely powerful because almost any function, built-in or user-defined, can be used to manipulate the output order.
If the ordering requirement is to order an iterable by the last letter in each string (and if the letter is the same, then to use the next letter), then a function can be defined and then used in the sorting. The example below defines a function that reverses the string passed to it, and then that function is used as the argument for :
>>>
The slice syntax is used to reverse a string. Each element will have applied to it, and the sorting order will be based on the characters in the backwards word.
Instead of writing a standalone function, you can use a function defined in the argument.
A is an anonymous function that:
- Must be defined inline
- Doesn’t have a name
- Can’t contain statements
- Will execute just like a function
In the example below, the is defined as a with no name, the argument taken by the is , and is the operation that will be performed on the argument:
>>>
is called on each element and reverses the word. That reversed output is then used for sorting, but the original words are still returned.
If the requirement changes, and the order should be reversed as well, then the keyword can be used alongside the argument:
>>>
functions are also useful when you need to sort objects based on a property. If you have a group of students and need to sort them by their final grade, highest to lowest, then a can be used to get the property from the :
>>>
This example uses to produce classes with and attributes. The calls on each element and returns the value for .
is set to to make the ascending output flipped to be descending so that the highest grades are ordered first.
The possibilities are endless for how ordering can be done when you leverage both the and keyword arguments on . Code can be kept clean and short when you use a basic for a small function, or you can write a whole new function, import it, and use it in the key argument.
Предварительное использование key в функции сортировки
До сих пор нашими ключевыми функциями были простые считыватели атрибутов, но они также могут вычислять значения для сортировки. Давайте взглянем на еще один пример. На этот раз мы определим класс Snake:
У нашей змеи есть имя, toxicity (токсичность, мерило того, насколько токсичен её яд) и agression (представленная в виде числа от 0 до 1, которое указывает на вероятность того, что змея нападет).
Теперь предположим, что мы можем подсчитать, насколько опасная змея, основываясь на показателях токсичности и агрессивности, и можем отсортировать список змей по степени их опасности:
Змеи отсортированы в ожидаемом нами порядке (несмотря на то, что гремучая змея (rattlesnake) более ядовита, чем кобра (kingCobra), уровень агрессивности кобры делает её более опасной).
Key Functions¶
Both and have a key parameter to specify a
function (or other callable) to be called on each list element prior to making
comparisons.
For example, here’s a case-insensitive string comparison:
>>> sorted("This is a test string from Andrew".split(), key=str.lower)
The value of the key parameter should be a function (or other callable) that
takes a single argument and returns a key to use for sorting purposes. This
technique is fast because the key function is called exactly once for each
input record.
A common pattern is to sort complex objects using some of the object’s indices
as keys. For example:
>>> student_tuples = ... ('john', 'A', 15), ... ('jane', 'B', 12), ... ('dave', 'B', 10), ... >>> sorted(student_tuples, key=lambda student student2]) # sort by age
The same technique works for objects with named attributes. For example:
>>> class Student ... def __init__(self, name, grade, age): ... self.name = name ... self.grade = grade ... self.age = age ... def __repr__(self): ... return repr((self.name, self.grade, self.age))
Пирамидальная сортировка
Также известна как сортировка кучей. Этот популярный алгоритм, как и сортировки вставками или выборкой, сегментирует список на две части: отсортированную и неотсортированную. Алгоритм преобразует второй сегмент списка в структуру данных «куча» (heap), чтобы можно было эффективно определить самый большой элемент.
Алгоритм
Сначала преобразуем список в Max Heap — бинарное дерево, где самый большой элемент является вершиной дерева. Затем помещаем этот элемент в конец списка. После перестраиваем Max Heap и снова помещаем новый наибольший элемент уже перед последним элементом в списке.
Этот процесс построения кучи повторяется, пока все вершины дерева не будут удалены.
Python NumPy
NumPy IntroNumPy Getting StartedNumPy Creating ArraysNumPy Array IndexingNumPy Array SlicingNumPy Data TypesNumPy Copy vs ViewNumPy Array ShapeNumPy Array ReshapeNumPy Array IteratingNumPy Array JoinNumPy Array SplitNumPy Array SearchNumPy Array SortNumPy Array FilterNumPy Random
Random Intro
Data Distribution
Random Permutation
Seaborn Module
Normal Distribution
Binomial Distribution
Poisson Distribution
Uniform Distribution
Logistic Distribution
Multinomial Distribution
Exponential Distribution
Chi Square Distribution
Rayleigh Distribution
Pareto Distribution
Zipf Distribution
NumPy ufunc
ufunc Intro
ufunc Create Function
ufunc Simple Arithmetic
ufunc Rounding Decimals
ufunc Logs
ufunc Summations
ufunc Products
ufunc Differences
ufunc Finding LCM
ufunc Finding GCD
ufunc Trigonometric
ufunc Hyperbolic
ufunc Set Operations
The Old Way Using the cmp Parameter
Many constructs given in this HOWTO assume Python 2.4 or later. Before that, there was no sorted() builtin and list.sort() took no keyword arguments. Instead, all of the Py2.x versions supported a cmp parameter to handle user specified comparison functions.
In Py3.0, the cmp parameter was removed entirely (as part of a larger effort to simplify and unify the language, eliminating the conflict between rich comparisons and the __cmp__ methods).
In Py2.x, sort allowed an optional function which can be called for doing the comparisons. That function should take two arguments to be compared and then return a negative value for less-than, return zero if they are equal, or return a positive value for greater-than. For example, we can do:
>>> def numeric_compare(x, y): return x - y >>> sorted(, cmp=numeric_compare)
Or you can reverse the order of comparison with:
>>> def reverse_numeric(x, y): return y - x >>> sorted(, cmp=reverse_numeric)
When porting code from Python 2.x to 3.x, the situation can arise when you have the user supplying a comparison function and you need to convert that to a key function. The following wrapper makes that easy to do:
def cmp_to_key(mycmp): 'Convert a cmp= function into a key= function' class K(object): def __init__(self, obj, *args): self.obj = obj def __lt__(self, other): return mycmp(self.obj, other.obj) < 0 def __gt__(self, other): return mycmp(self.obj, other.obj) > 0 def __eq__(self, other): return mycmp(self.obj, other.obj) == 0 def __le__(self, other): return mycmp(self.obj, other.obj) <= 0 def __ge__(self, other): return mycmp(self.obj, other.obj) >= 0 def __ne__(self, other): return mycmp(self.obj, other.obj) != 0 return K
To convert to a key function, just wrap the old comparison function:
>>> sorted(, key=cmp_to_key(reverse_numeric))
In Python 2.7, the cmp_to_key() tool was added to the functools module.
Скорость сортировки в Python
Python
# speed/main.py
import random
from boxx import timeit
def list_sort(arr):
return arr.sort()
def sorted_builtin(arr):
return sorted(arr)
def main():
arr =
with timeit(name=»sorted(list)»):
sorted_builtin(arr)
with timeit(name=»list.sort()»):
list_sort(arr)
if __name__ == «__main__»:
main()
1 |
# speed/main.py importrandom fromboxx importtimeit deflist_sort(arr) returnarr.sort() defsorted_builtin(arr) returnsorted(arr) defmain() arr=random.randint(,50)forrinrange(1_000_000) withtimeit(name=»sorted(list)») sorted_builtin(arr) withtimeit(name=»list.sort()») list_sort(arr) if__name__==»__main__» main() |
Указанный выше код выводит следующий результат:
Shell
$ python main.py
«sorted(list)» spend time: 0.1104379
«list.sort()» spend time: 0.0956471
1 |
$python main.py «sorted(list)»spend time0.1104379 «list.sort()»spend time0.0956471 |
Как видите, метод немного быстрее, чем функция . Почему так получается? Разберем обе функции и посмотрим, сможет ли байтовый код дать ответ:
Python
>>> import dis
>>> dis.dis(list_sort)
12 0 LOAD_FAST 0 (arr)
2 LOAD_METHOD 0 (sort)
4 CALL_METHOD 0
6 RETURN_VALUE
>>> dis.dis(sorted_builtin)
16 0 LOAD_GLOBAL 0 (sorted)
2 LOAD_FAST 0 (arr)
4 CALL_FUNCTION 1
6 RETURN_VALUE
1 |
>>>importdis >>>dis.dis(list_sort) 12LOAD_FAST(arr) 2LOAD_METHOD(sort) 4CALL_METHOD 6RETURN_VALUE >>>dis.dis(sorted_builtin) 16LOAD_GLOBAL(sorted) 2LOAD_FAST(arr) 4CALL_FUNCTION1 6RETURN_VALUE |
Байтовый код обеих функций практически идентичен. Единственное различие в том, что функция сначала загружает список, и за методом (sort) следует вызванный метод списка без аргументов. Если сравнить, функция сначала загружает встроенную функцию , а за ней следует список и вызов загруженной функции со списком в качестве аргумента.
Почему же временные результаты отличаются?
Можно предположить, что в то время как может работать с известным размером и менять элементы внутри данного размера, должен работать c неизвестным размером. Следовательно, если при добавлении нового элемента не хватает памяти, нужно изменить размер нового списка, созданного через . На это требуется время! Если просмотреть исходный код CPython, можно найти следующий комментарий об изменении размера списка объектов:
Помните, что сейчас мы работаем со списком из 1 000 000 элементов — изменений размера будет довольно много! К несчастью, пока что это лучший ответ на вопрос, почему на 13% быстрее, чем .
Python
new_array = arr.copy()
arr.sort()
1 |
new_array=arr.copy() arr.sort() |
Имплементация приводит к разнице во времени выполнения, поскольку создание копии списка занимает некоторое время.
Простая сортировка
Чтобы отсортировать список по возрастанию вызовите функцию sorted(). Функция вернёт новый сортированный список:
>>>
>>> sorted()
1 |
>>> >>>sorted(5,2,3,1,4) 1,2,3,4,5 |
Метод сортирует список у которого вызван и возвращает None. Если исходный список больше не нужен это может быть немного эффективнее:
>>> a =
>>> a.sort()
>>> a
1 |
>>>a=5,2,3,1,4 >>>a.sort() >>>a 1,2,3,4,5 |
Метод определён только для списков. В отличи от него, функция sorted() работает с любыми перечисляемыми объектами:
>>> sorted({1: ‘D’, 2: ‘B’, 3: ‘B’, 4: ‘E’, 5: ‘A’})
1 |
>>>sorted({1’D’,2’B’,3’B’,4’E’,5’A’}) 1,2,3,4,5 |
Что такое списки?
Списки в Python — упорядоченные изменяемые коллекции объектов произвольных типов (почти как массив, но типы могут отличаться).
Чтобы использовать списки, их нужно создать. Создать список можно несколькими способами. Например, можно обработать любой итерируемый объект (например, строку) встроенной функцией list:
>>> list('список')
Список можно создать и при помощи литерала:
>>> s = [] # Пустой список >>> l = 's', 'p', 'isok'], 2 >>> s [] >>> l , 2]
Как видно из примера, список может содержать любое количество любых объектов (в том числе и вложенные списки), или не содержать ничего.
И еще один способ создать список — это генераторы списков. Генератор списков — способ построить новый список, применяя выражение к каждому элементу последовательности. Генераторы списков очень похожи на цикл for.
>>> c = c * 3 for c in 'list' >>> c
Возможна и более сложная конструкция генератора списков:
>>> c = c * 3 for c in 'list' if c != 'i' >>> c >>> c = c + d for c in 'list' if c != 'i' for d in 'spam' if d != 'a' >>> c
Прочее
Для сортировки с учётом языка используйте в качестве ключевой функции или в качестве функции сравнения.
Параметр всё ещё сохраняет стабильность сортировки. Что интересно, этот эффект можно сымитировать без параметра, использовав встроенную функцию дважды:
Чтобы создать стандартный порядок сортировки для класса, просто добавьте реализацию соответствующих методов сравнения:
Для типов, сравнение которых работает обычным образом, рекомендуется определять все 6 операторов. Декоратор классов упрощает их реализацию.
Функциям-ключам не нужен доступ к внутренним данным сортируемых объектов. Они также могут осуществлять доступ к внешним ресурсам. Например, если оценки ученика хранятся в словаре, их можно использовать для сортировки отдельного списка с именами учеников:
Обработка текста в NumPy на примерах
Когда дело доходит до текста, подход несколько меняется. Цифровое представление текста предполагает создание некого , то есть инвентаря всех уникальных слов, которые бы распознавались моделью, а также векторно (embedding step). Попробуем представить в цифровой форме цитату из стихотворения арабского поэта Антара ибн Шаддада, переведенную на английский язык:
“Have the bards who preceded me left any theme unsung?”
Перед переводом данного предложения в нужную цифровую форму модель должна будет проанализировать огромное количество текста. Здесь можно обработать небольшой набор данный, после чего использовать его для создания словаря из 71 290 слов.
Предложение может быть разбито на массив токенов, что будут словами или частями слов в зависимости от установленных общих правил:
Затем в данной таблице словаря вместо каждого слова мы ставим его :
Однако данные все еще не обладают достаточным количеством информации о модели как таковой. Поэтому перед передачей последовательности слов в модель токены/слова должны быть заменены их векторными представлениями. В данном случае используется 50-мерное векторное представление Word2vec.
Здесь ясно видно, что у массива NumPy есть несколько размерностей . На практике все выглядит несколько иначе, однако данное визуальное представление более понятно для разъяснения общих принципов работы.
Для лучшей производительности модели глубокого обучения обычно сохраняют первую размерность для пакета. Это происходит из-за того, что тренировка модели происходит быстрее, если несколько примеров проходят тренировку параллельно. Здесь особенно полезным будет . Например, такая модель, как BERT, будет ожидать ввода в форме: .
Теперь мы получили числовой том, с которым модель может работать и делать полезные вещи. Некоторые строки остались пустыми, однако они могут быть заполнены другими примерами, на которых модель может тренироваться или делать прогнозы.
(На заметку: Поэма, строчку из которой мы использовали в примере, увековечила своего автора в веках. Будучи незаконнорожденным сыном главы племени от рабыни, Антара ибн Шаддан мастерски владел языком поэзии. Вокруг исторической фигуры поэта сложились мифы и легенды, а его стихи стали частью классической арабской литературы).
Python NumPy
NumPy IntroNumPy Getting StartedNumPy Creating ArraysNumPy Array IndexingNumPy Array SlicingNumPy Data TypesNumPy Copy vs ViewNumPy Array ShapeNumPy Array ReshapeNumPy Array IteratingNumPy Array JoinNumPy Array SplitNumPy Array SearchNumPy Array SortNumPy Array FilterNumPy Random
Random Intro
Data Distribution
Random Permutation
Seaborn Module
Normal Distribution
Binomial Distribution
Poisson Distribution
Uniform Distribution
Logistic Distribution
Multinomial Distribution
Exponential Distribution
Chi Square Distribution
Rayleigh Distribution
Pareto Distribution
Zipf Distribution
NumPy ufunc
ufunc Intro
ufunc Create Function
ufunc Simple Arithmetic
ufunc Rounding Decimals
ufunc Logs
ufunc Summations
ufunc Products
ufunc Differences
ufunc Finding LCM
ufunc Finding GCD
ufunc Trigonometric
ufunc Hyperbolic
ufunc Set Operations
Sort Stability and Complex Sorts
Starting with Python 2.2, sorts are guaranteed to be . That means that when multiple records have the same key, their original order is preserved.
>>> data = >>> sorted(data, key=itemgetter(0))
Notice how the two records for 'blue' retain their original order so that ('blue', 1) is guaranteed to precede ('blue', 2).
This wonderful property lets you build complex sorts in a series of sorting steps. For example, to sort the student data by descending grade and then ascending age, do the age sort first and then sort again using grade:
>>> s = sorted(student_objects, key=attrgetter('age')) # sort on secondary key >>> sorted(s, key=attrgetter('grade'), reverse=True) # now sort on primary key, descending
The Timsort algorithm used in Python does multiple sorts efficiently because it can take advantage of any ordering already present in a dataset.
Стабильность сортировки и сложные сортировки
Сортировки гарантированно . Это означает, что когда несколько записей имеют один и тот же ключ, их исходный порядок сохраняется.
>>> data = >>> sorted(data, key=itemgetter(0))
Обратите внимание, что две записи для сохраняют свой исходный порядок, поэтому гарантированно предшествует. Это замечательное свойство позволяет создавать сложные сортировки в несколько этапов
Например, чтобы отсортировать данные учащиеся по убыванию класса, а затем по возрастанию возраста, сделать возраст своего рода первым, а затем сортировать снова используя класс:
Это замечательное свойство позволяет создавать сложные сортировки в несколько этапов. Например, чтобы отсортировать данные учащиеся по убыванию класса, а затем по возрастанию возраста, сделать возраст своего рода первым, а затем сортировать снова используя класс:
>>> s = sorted(student_objects, key=attrgetter('age')) # sort on secondary key >>> sorted(s, key=attrgetter('grade'), reverse=True) # now sort on primary key, descending
Можно абстрагировать все это в функцию-оболочку, которая может принимать список и кортежи поля и упорядочивать их за нескольких проходах.
>>> def multisort(xs, specs): ... for key, reverse in reversed(specs): ... xs.sort(key=attrgetter(key), reverse=reverse) ... return xs >>> multisort(list(student_objects), (('grade', True), ('age', False)))
The Old Way Using the cmp Parameter¶
Many constructs given in this HOWTO assume Python 2.4 or later. Before that,
there was no builtin and took no keyword
arguments. Instead, all of the Py2.x versions supported a cmp parameter to
handle user specified comparison functions.
In Py3.0, the cmp parameter was removed entirely (as part of a larger effort to
simplify and unify the language, eliminating the conflict between rich
comparisons and the magic method).
In Py2.x, sort allowed an optional function which can be called for doing the
comparisons. That function should take two arguments to be compared and then
return a negative value for less-than, return zero if they are equal, or return
a positive value for greater-than. For example, we can do:
>>> def numeric_compare(x, y): ... return x - y >>> sorted(, cmp=numeric_compare)
Or you can reverse the order of comparison with:
>>> def reverse_numeric(x, y): ... return y - x >>> sorted(, cmp=reverse_numeric)
When porting code from Python 2.x to 3.x, the situation can arise when you have
the user supplying a comparison function and you need to convert that to a key
function. The following wrapper makes that easy to do:
def cmp_to_key(mycmp): 'Convert a cmp= function into a key= function' class K def __init__(self, obj, *args): self.obj = obj def __lt__(self, other): return mycmp(self.obj, other.obj) < def __gt__(self, other): return mycmp(self.obj, other.obj) > def __eq__(self, other): return mycmp(self.obj, other.obj) == def __le__(self, other): return mycmp(self.obj, other.obj) <= def __ge__(self, other): return mycmp(self.obj, other.obj) >= def __ne__(self, other): return mycmp(self.obj, other.obj) != return K
To convert to a key function, just wrap the old comparison function:
>>> sorted(, key=cmp_to_key(reverse_numeric))
Встроенные функции сортировки на Python
Иногда полезно знать перечисленные выше алгоритмы, но в большинстве случаев разработчик, скорее всего, будет использовать функции сортировки, уже предоставленные в языке программирования.
Отсортировать содержимое списка можно с помощью стандартного метода :
Или можно использовать функцию для создания нового отсортированного списка, оставив входной список нетронутым:
Оба эти метода сортируют в порядке возрастания, но можно изменить порядок, установив для флага значение :
В отличие от других алгоритмов, обе функции в Python могут сортировать также списки кортежей и классов. Функция может сортировать любую последовательность, которая включает списки, строки, кортежи, словари, наборы и пользовательские итераторы, которые вы можете создать.
Функции в Python реализуют алгоритм Tim Sort, основанный на сортировке слиянием и сортировке вставкой.
Odd and Ends¶
-
For locale aware sorting, use for a key function or
for a comparison function. -
The reverse parameter still maintains sort stability (so that records with
equal keys retain the original order). Interestingly, that effect can be
simulated without the parameter by using the builtin function
twice:>>> data = >>> standard_way = sorted(data, key=itemgetter(), reverse=True) >>> double_reversed = list(reversed(sorted(reversed(data), key=itemgetter()))) >>> assert standard_way == double_reversed >>> standard_way
-
The sort routines are guaranteed to use when making comparisons
between two objects. So, it is easy to add a standard sort order to a class by
defining an method:>>> Student.__lt__ = lambda self, other self.age < other.age >>> sorted(student_objects)
-
Key functions need not depend directly on the objects being sorted. A key
function can also access external resources. For instance, if the student grades
are stored in a dictionary, they can be used to sort a separate list of student
names:>>> students = 'dave', 'john', 'jane' >>> newgrades = {'john' 'F', 'jane''A', 'dave' 'C'} >>> sorted(students, key=newgrades.__getitem__)