Говорят, что новый Python 3.7 стал намного быстрее и удобнее. Мы решили убедиться в этом и детально разобрали 7 важных изменений.
Стало легче создавать классы и работать с модулями, давно используемые неофициальные возможности наконец-то получили признание, а измерение времени вышло на новый уровень.
Упрощенное создание классов
В Python 3.7 появился новый модуль dataclasses и декоратор @dataclass
, облегчающий создание пользовательских классов. Он автоматически добавляет специальные методы вроде __init__
, __repr__
и __eq__
.
from dataclasses import dataclass, field
@dataclass(order=True)
class Country:
name: str
population: int
area: float = field(repr=False, compare=False)
coastline: float = 0
def beach_per_person(self):
"""Meters of coastline per person"""
return (self.coastline * 1000) / self.population
Вот он – пример отличного шаблона класса в лучших практиках кодинга. Только вспомните, как пришлось бы создавать Country
раньше. Помимо beach_per_person
нужно было описать методы инициализации, вывода и целых 6 методов для сравнения. Просто посмотрите на это:
[spoiler title='Класс Country в привычном виде']
class Country:
def __init__(self, name, population, area, coastline=0):
self.name = name
self.population = population
self.area = area
self.coastline = coastline
def __repr__(self):
return (
f"Country(name={self.name!r}, population={self.population!r},"
f" coastline={self.coastline!r})"
)
def __eq__(self, other):
if other.__class__ is self.__class__:
return (
(self.name, self.population, self.coastline)
== (other.name, other.population, other.coastline)
)
return NotImplemented
def __ne__(self, other):
if other.__class__ is self.__class__:
return (
(self.name, self.population, self.coastline)
!= (other.name, other.population, other.coastline)
)
return NotImplemented
def __lt__(self, other):
if other.__class__ is self.__class__:
return ((self.name, self.population, self.coastline) < (
other.name, other.population, other.coastline
))
return NotImplemented
def __le__(self, other):
if other.__class__ is self.__class__:
return ((self.name, self.population, self.coastline) <= (
other.name, other.population, other.coastline
))
return NotImplemented
def __gt__(self, other):
if other.__class__ is self.__class__:
return ((self.name, self.population, self.coastline) > (
other.name, other.population, other.coastline
))
return NotImplemented
def __ge__(self, other):
if other.__class__ is self.__class__:
return ((self.name, self.population, self.coastline) >= (
other.name, other.population, other.coastline
))
return NotImplemented
def beach_per_person(self):
"""Meters of coastline per person"""
return (self.coastline * 1000) / self.population
[/spoiler]
Новый Python берет эту тяжелую работу на себя.
Классы данных совершенно идентичны обычным. Например, от них легко можно наследовать. И используются они аналогичным образом:
>>> norway = Country("Norway", 5320045, 323802, 58133)
>>> norway
Country(name='Norway', population=5320045, coastline=58133)
>>> norway.area
323802
>>> usa = Country("United States", 326625791, 9833517, 19924)
>>> nepal = Country("Nepal", 29384297, 147181)
>>> nepal
Country(name='Nepal', population=29384297, coastline=0)
>>> usa.beach_per_person()
0.06099946957342386
>>> norway.beach_per_person()
10.927163210085629
Поля name
, population
, area
и coastline
устанавливаются при инициализации класса. При этом длина береговой линии – это необязательный параметр. Закрытый со всех сторон Непал, например, его не использует.
По умолчанию, классы данных можно сравнивать, а если в декораторе установлено свойство order
, равное True
, то еще и сортировать.
>>> norway == norway
True
>>> nepal == usa
False
>>> sorted((norway, usa, nepal))
[Country(name='Nepal', population=29384297, coastline=0),
Country(name='Norway', population=5320045, coastline=58133),
Country(name='United States', population=326625791, coastline=19924)]
Сортировка идет поочередно по значениям полей, начиная с name
. Существует возможность настроить с помощью функции field
, какие конкретно поля должны в этом участвовать. Например, свойство area
не учитывается ни в выводе, ни в сравнении.
Классы данных очень похожи на namedtuple. Также их создатели черпали вдохновение в проекте attrs. Больше информации о новом модуле вы можете найти в PEP 557.
Атрибуты модулей
Атрибуты в Python везде, на них основана такая базовая функциональность языка, как интроспекция, документирование кода и пространства имен.
Обратиться к атрибуту можно с помощью оператора точка thing.attribute
. Для получения атрибутов, созданных в процессе выполнения программы, используется функция getattr
:
import random
random_attr = random.choice(("gammavariate", "lognormvariate", "normalvariate"))
random_func = getattr(random, random_attr)
print(f"A {random_attr} random value: {random_func(1, 1)}")
Этот код выведет нечто подобное:
A gammavariate random value: 2.8017715125270618
Если вы вызываете thing.attribute
для классов, то первым делом интерпретатор проверяет, определен ли такой атрибут у thing
. Если нет, то он передает управление методу thing.__getattr__("attr")
. Это упрощенное описание, узнать подробнее вы можете здесь. Таким образом, с помощью __getattr__
можно контролировать доступ к атрибутам объекта.
До появления версии 3.7 осуществить подобное с модулями было непросто. Однако новый Python добавил в них __getattr__
и __dir__
– специальный метод для настройки вызова dir
.
PEP 562 демонстрирует несколько примеров использования этих функций. В частности, с их помощью можно реализовать оповещения об устаревании или медленной загрузке. А мы напишем несложную систему плагинов для динамического добавления функций в модуль. Вам потребуется общее представление о пакетах в Python. Чтобы освежить его, загляните сюда.
Создайте папку с именем plugins
, а в ней – __init__.py
:
from importlib import import_module
from importlib import resources
PLUGINS = dict()
def register_plugin(func):
"""Декоратор для регистрации плагинов"""
name = func.__name__
PLUGINS[name] = func
return func
def __getattr__(name):
"""Возвращает плагин по его имени"""
try:
return PLUGINS[name]
except KeyError:
_import_plugins()
if name in PLUGINS:
return PLUGINS[name]
else:
raise AttributeError(
f"module {__name__!r} has no attribute {name!r}"
) from None
def __dir__():
"""Список доступных плагинов"""
_import_plugins()
return list(PLUGINS.keys())
def _import_plugins():
"""Импортирует все ресурсы для регистрации плагинов"""
for name in resources.contents(__name__):
if name.endswith(".py"):
import_module(f"{__name__}.{name[:-3]}")
Разместите код плагинов в файлах plugin_1.py
и plugin_2.py
:
from . import register_plugin
@register_plugin
def hello_1():
print("Hello from Plugin 1")
from . import register_plugin
@register_plugin
def hello_2():
print("Hello from Plugin 2")
@register_plugin
def goodbye():
print("Plugin 2 says goodbye")
Теперь запустите программу:
>>> import plugins
>>> plugins.hello_1()
Hello from Plugin 1
>>> dir(plugins)
['goodbye', 'hello_1', 'hello_2']
>>> plugins.goodbye()
Plugin 2 says goodbye
Здесь происходит что-то удивительное. Чтобы вызвать plugins.hello_1
, мы должны были явно импортировать его в __init__.py
, разве не так? Теперь нет!
Новые возможности модулей
Мы просто определяем hello_1
в любом файле пакета, и он самостоятельно регистрируется благодаря декоратору.
Есть разница, правда? Эта простая структура позволяет добавлять функциональность без привязки к остальному коду и централизованного объявления доступности.
Итак, что же делает __getattr__
внутри __init__.py
? При вызове plugins.hello_1
интерпретатор сначала проверяет, объявлена ли такая функция и, естественно, не находит ее. Тогда он обращается к методу __getattr__("hello_1")
. У нас он выглядит вот так:
def __getattr__(name):
"""Возвращает плагин по имени"""
try:
return PLUGINS[name] # 1) Пытается вернуть плагин
except KeyError:
_import_plugins() # 2) Импортирует все плагины
if name in PLUGINS:
return PLUGINS[name] # 3) Снова пытается вернуть плагин
else:
raise AttributeError( # 4) Выбрасывает ошибку
f"module {__name__!r} has no attribute {name!r}"
) from None
Что делает этот метод?
- Проверяет существование свойства с именем
"hello_1"
в словареPLUGINS
. Но на данный момент его там нет. - Из-за неудачи переходит в секцию
except
и импортирует плагины. - После этого у
PLUGINS
должно появиться нужное свойство, которое можно вернуть вызывающему коду. - Если что-то пошло не так, и после импорта нужный плагин не обнаружился, функция выбросит ошибку
AttributeError
.
По-прежнему непонятно, каким образом плагины попадают в словарь, ведь _import_plugins
просто загружает файлы, но не изменяет PLUGINS
:
def _import_plugins():
"""Импортирует все ресурсы для регистрации плагинов"""
for name in resources.contents(__name__):
if name.endswith(".py"):
import_module(f"{__name__}.{name[:-3]}")
Вспомните, что каждый плагин декорирован с помощью @register_plugin
. При импорте он и записывает свое имя в в словарь. Загрузите один файл самостоятельно, чтобы убедиться в этом:
>>> import plugins
>>> plugins.PLUGINS
{}
>>> import plugins.plugin_1
>>> plugins.PLUGINS
{'hello_1': <function hello_1 at 0x7f29d4341598>}
Теперь вызовем dir
и увидим, что импортируются оставшиеся плагины.
>>> dir(plugins)
['goodbye', 'hello_1', 'hello_2']
>>> plugins.PLUGINS
{'hello_1': <function hello_1 at 0x7f29d4341598>,
'hello_2': <function hello_2 at 0x7f29d4341620>,
'goodbye': <function goodbye at 0x7f29d43416a8>}
Обычно этот метод перечисляет все атрибуты полученного объекта, что выглядит примерно так:
>>> import plugins
>>> dir(plugins)
['PLUGINS', '__builtins__', '__cached__', '__doc__',
'__file__', '__getattr__', '__loader__', '__name__',
'__package__', '__path__', '__spec__', '_import_plugins',
'import_module', 'register_plugin', 'resources']
Конечно, это довольно полезно, но хотелось бы просто увидеть доступные плагины. Новый Python позволяет настроить и это. Специальная функция __dir__
изменяет результаты вызова dir
. В примере она сначала проверяет, импортированы ли все плагины, а затем выводит список их имен.
def __dir__():
"""Список доступных плагинов"""
_import_plugins()
return list(PLUGINS.keys())
Здесь используется еще одно нововведение Python 3.7: модуль importlib.resources. С его помощью мы загрузили модули из папки plugins
без обращения к __file__
или pkg_resources
.
Наносекундная точность
Python 3.7 добавил несколько новых возможностей в модуль time, которые были описаны в PEP 564, например:
- clock_gettime_ns() - получение времени указанных часов;
- clock_settime_ns() - установка времени указанных часов;
- monotonic_ns() - получение времени относительных часов без отката (например, из-за летнего времени);
- perf_counter_ns() - получение значения счетчика выполнения, предназначенного для измерения коротких промежутков;
- process_time_ns() - получение суммы системного времени для конкретного процесса (без учета спящего режима);
- time_ns() - получение количества наносекунд с 01.01.1970.
Похоже, никакой новой функциональности тут нет. Каждый метод уже имеет свой аналог, лишь добавился суффикс _ns
. Разница заключается в том, что эти новые функции возвращают значение с типом int
в наносекундах вместо количества секунд с типом float
.
Большинство приложений не заметит эту разницу. Однако в целом работа со временем становится понятнее и проще. Дело в том, что тип float
по определению неточный, в отличие от int
:
>>> 0.1 + 0.1 + 0.1
0.30000000000000004
>>> 0.1 + 0.1 + 0.1 == 0.3
False
Это имеет значение для больших чисел, так как компьютер вынужден умещать бесконечное количество символов в ограниченном объеме битов.
Для типа float
в Python по стандарту используется 53 значащих байта. Поэтому любой период времени больше 104 дней (9 квадриллионов наносекунд) нельзя точно представить в типе float
. А вот int
в Python не имеет ограничений, поэтому в нем можно хранить любые значения с наносекундной точностью.
Например, time.time()
возвращает прошедшее с начала UNIX-эпохи время в секундах – огромное число. Новая _ns
версия функции работает почти в 3 раза быстрее старой.
Модуль datetime
работает только с микросекундами:
>>> from datetime import datetime, timedelta
>>> datetime(2018, 6, 27) + timedelta(seconds=1e-6)
datetime.datetime(2018, 6, 27, 0, 0, 0, 1)
>>> datetime(2018, 6, 27) + timedelta(seconds=1e-9)
datetime.datetime(2018, 6, 27, 0, 0)
Поэтому, если вы желаете наносекундной точности, обратите внимание на проект astropy и его пакет astropy.time, который доступен в Python 3.5+.
>>> from astropy.time import Time, TimeDelta
>>> Time("2018-06-27")
<Time object: scale='utc' format='iso' value=2018-06-27 00:00:00.000>
>>> t = Time("2018-06-27") + TimeDelta(1e-9, format="sec")
>>> (t - Time("2018-06-27")).sec
9.976020010071807e-10
Официальное упорядочивание словарей
Python 3.7 на официальном уровне зафиксировал соответствие порядка перебора элементов словарей порядку их добавления.
Разве это новость? – спросите вы. В Python 3.6 словари уже были упорядочены, что видно на примере:
# Python <= 3.5
>>> {"one": 1, "two": 2, "three": 3}
{'three': 3, 'one': 1, 'two': 2}
# Python >= 3.6
>>> {"one": 1, "two": 2, "three": 3}
{'one': 1, 'two': 2, 'three': 3}
Однако это был просто удобный побочный результат реализации, не зафиксированный в стандарте. Новый Python оформил его официально. Теперь можно быть уверенным в сохранении порядка вставки.
Признание async и await
Синтаксис async/await
появился еще в Python 3.5, однако только сейчас эти слова официально стали ключевыми.
Теперь нельзя объявлять функции и переменные с такими именами.
>>> async = 1
File "<stdin>", line 1
async = 1
^
SyntaxError: invalid syntax
>>> def await():
File "<stdin>", line 1
def await():
^
SyntaxError: invalid syntax
Это не было сделано раньше в целях обеспечения обратной совместимости, но наконец время пришло.
Переменные контекста
Эти переменные могут хранить разные значения в зависимости от контекста использования, что очень похоже на потоковое локальное хранилище, где каждый поток работает с собственными данные. Это полезно для отслеживания значения в асинхронных задачах.
Создадим три контекста, каждый с собственным name
:
import contextvars
name = contextvars.ContextVar("name")
contexts = list()
def greet():
print(f"Hello {name.get()}")
# создание контекстов с разными значениями переменной name
for first_name in ["Steve", "Dina", "Harry"]:
ctx = contextvars.copy_context()
ctx.run(name.set, first_name)
contexts.append(ctx)
# запуск функции в каждом контексте
for ctx in reversed(contexts):
ctx.run(greet)
Этот скрипт поприветствует в обратном порядке Стива, Дину и Гарри:
$ python3.7 context_demo.py
Hello Harry
Hello Dina
Hello Steve
Новый уровень asyncio
Модуль asyncio предназначен для асинхронного выполнения кода. Он был добавлен в Python 3.4. Если вы до сих пор с ним не знакомы, обратите внимание на это руководство.
Новый Python добавил в asyncio ряд новых функций и поддержку переменных контекста. Например, asyncio.run() позволяет вызывать сопрограммы без создания событийного цикла:
import asyncio
async def hello_world():
print("Hello World!")
asyncio.run(hello_world())
В целом модуль стал работать быстрее и эффективнее.
Переход на новый Python
Конечно, вам уже не терпится попробовать все новые возможности языка. Установите Python 3.7 и смело экспериментируйте! Вы даже можете использовать разные версии интерпретатора параллельно с помощью pyenv или Anaconda.
Если вы уже задумались об обновлении работающего проекта, тщательно взвесьте это решение и протестируйте все изменения. Помните о нескольких нововведениях, которые могут сломать старый код. В их числе ключевые слова async
и await
.
Большинство обновок Python 3.7, например, dataclasses
, имеют бэкпорты в более старых версиях языка или менее удобные аналоги. Но использование некоторых возможностей крепко привяжет ваш код к новому стандарту. Среди них наносекундный тайминг и атрибуты модулей.
Здесь вы найдете несколько рекомендаций по обновлению.
Перевод статьи Cool New Features in Python 3.7.
Комментарии