`get_versions` without importing packages #5724

gjoseph92 · 2022-01-27T23:57:58Z

This makes the version-compatibility check no longer actually import the packages being checked.

It also removes support for custom version-getting functions, and only uses importlib.metadata.version (EDIT: or pkg_resources on 3.7) to look up the version number registered for a package.

I assumed the purpose of custom version-getting functions was to handle discrepancies in how modules expose their version as an attribute, like how most use .__version__, but tornado uses .version, msgpack uses .version but it's a tuple of ints instead of a string, etc. That becomes irrelevant with importlib.metadata.version, which will always give you the version number of any reasonably-formed package as a string.

You could use this (modname, version_getter_func) form as an argument to Client.get_versions, so not supporting the tuple form in theory is a breaking change to a public API. However, that form isn't documented, so I don't know if that counts.

If we want to maintain support for those custom functions, I will, it just makes the code messier.

Closes Don't import packages just for version compatibility check #5723
Tests added / passed
Passes pre-commit run --all-files

gjoseph92 · 2022-01-28T00:01:35Z

importlib.metadata is 3.8 only 🤦‍♂️

Do we want to use the backport? https://github.com/python/importlib_metadata

crusaderky · 2022-01-28T01:05:23Z

importlib.metadata is 3.8 only man_facepalming

Do we want to use the backport? https://github.com/python/importlib_metadata

pkg_resources.get_distribution("numpy").version

distributed/versions.py

gjoseph92 · 2022-01-28T01:19:06Z

The Python docs seem to suggest importlib.metadata over pkg_resources.

Along with importlib.resources in Python 3.7 and newer (backported as importlib_resources for older versions of Python), this can eliminate the need to use the older and less efficient pkg_resources package.
https://docs.python.org/3/library/importlib.metadata.html

The pkg_resources docs say the same:

Use of pkg_resources is discouraged in favor of importlib.resources, importlib.metadata, and their backports (resources, metadata). Please consider using those libraries instead of pkg_resources.
https://setuptools.pypa.io/en/latest/pkg_resources.html

I guess instead of requiring the backport, I could use pkg_resources on 3.7 and importlib.metadata when it's available? Seems like a fine compromise.

xfail'd until dask#5724

gjoseph92 · 2022-01-28T03:19:56Z

The number of flaky-seeming test failures here is concerning me. Could it be that not importing pandas on the workers is allowing them to start faster, and making race conditions even more likely to happen? Or something like that?

crusaderky · 2022-01-28T09:39:14Z

I don't get it - I thought that in order to not import pandas we need both this and #5695?
Rerunning tests to see if it's a temporary VM issue.

crusaderky · 2022-01-28T09:41:18Z

Looking at the runtimes of the heavily flaky test suites, I'm seeing 1h+ runtime instead of the usual 30min. Which is something I've seen in the past on main. So I suspect it may be github's fault.

gjoseph92 · 2022-01-28T16:29:31Z

I don't get it - I thought that in order to not import pandas we need both this and #5695?

Totally correct—just forgot, sorry.

distributed/versions.py

crusaderky · 2022-01-28T17:11:39Z

Merged CI test of #5695 + #5724 running on crusaderky#2 and things don't look very good so far. I can see much more flakiness than main and much slower end-to-end test runtime.

crusaderky · 2022-01-31T10:00:18Z

CI is back on track; I've rerun all tests.
I can see a gazillion of failed tests.
The good news is, several of these are known flaky tests which seem to have become a lot more flaky in this PR.
This may be a good workbench to finally iron them out.
CC @fjetter

Failed tests (with number of failures):

      7 distributed/deploy/tests/test_adaptive.py::test_adapt_quickly
      6 distributed/deploy/tests/test_local.py::test_adapt_then_manual
      5 distributed/tests/test_worker.py::test_worker_reconnects_mid_compute_multiple_states_on_scheduler
      5 distributed/tests/test_worker.py::test_worker_reconnects_mid_compute
      5 distributed/tests/test_client.py::test_dump_cluster_state
      3 distributed/tests/test_worker.py::test_scheduler_delay
      3 distributed/tests/test_worker.py::test_lifetime
      3 distributed/tests/test_worker.py::test_gather_many_small
      3 distributed/tests/test_worker.py::test_avoid_oversubscription
      3 distributed/tests/test_steal.py::test_steal_twice
      3 distributed/tests/test_scheduler.py::test_worker_breaks_and_returns
      3 distributed/tests/test_scheduler.py::test_balance_many_workers_2
      3 distributed/tests/test_scheduler.py::test_balance_many_workers
      3 distributed/tests/test_client.py::test_run_rpc
      3 distributed/tests/test_client.py::test_get_versions_rpc
      3 distributed/deploy/tests/test_adaptive.py::test_target_duration
      3 distributed/deploy/tests/test_adaptive.py::test_adaptive_local_cluster_multi_workers
      2 distributed/tests/test_scheduler.py::test_profile_metadata
      2 distributed/tests/test_scheduler.py::test_idle_timeout 
      2 distributed/tests/test_multi_locks.py::test_timeout_wake_waiter
      1 distributed/tests/test_worker.py::test_statistical_profiling_cycle
      1 distributed/tests/test_worker.py::test_remove_replicas_while_computing
      1 distributed/tests/test_utils_test.py::test_assert_worker_story_malformed_story[story4]
      1 distributed/tests/test_steal.py::test_worksteal_many_thieves
      1 distributed/tests/test_steal.py::test_steal_when_more_tasks
      1 distributed/tests/test_steal.py::test_steal_more_attractive_tasks
      1 distributed/tests/test_steal.py::test_dont_steal_few_saturated_tasks_many_workers
      1 distributed/tests/test_steal.py::test_dont_steal_fast_tasks_compute_time
      1 distributed/tests/test_scheduler.py::test_worker_reconnect_task_memory 
      1 distributed/tests/test_scheduler.py::test_worker_heartbeat_after_cancel
      1 distributed/tests/test_scheduler.py::test_profile_metadata_timeout
      1 distributed/tests/test_scheduler.py::test_profile_metadata_keys
      1 distributed/tests/test_failed_workers.py::test_restart_fast

crusaderky · 2022-02-02T12:18:44Z

@gjoseph92 please merge from main

crusaderky · 2022-02-21T11:03:09Z

please

un-xfail pandas on test_no_unnecessary_imports_on_worker
merge from main to remove python 3.7
accept suggestions and lint

crusaderky · 2022-02-21T18:04:13Z

Latest run vs main: https://github.com/crusaderky/distributed/actions/runs/1875755877

Failures:

distributed/dashboard/tests/test_scheduler_bokeh.py::test_compute_per_key
distributed/deploy/tests/test_adaptive.py::??
distributed/deploy/tests/test_adaptive.py::test_adaptive_local_cluster_multi_workers 
distributed/deploy/tests/test_adaptive.py::test_adapt_quickly
distributed/deploy/tests/test_adaptive.py::test_adapt_quickly
distributed/deploy/tests/test_adaptive.py::test_adapt_quickly 
distributed/deploy/tests/test_adaptive.py::test_adapt_quickly 
distributed/deploy/tests/test_adaptive.py::test_target_duration
distributed/deploy/tests/test_adaptive.py::test_target_duration
distributed/deploy/tests/test_local.py::test_adapt_then_manual
distributed/deploy/tests/test_local.py::test_adapt_then_manual
distributed/deploy/tests/test_local.py::test_adapt_then_manual
distributed/deploy/tests/test_local.py::test_adapt_then_manual
distributed/deploy/tests/test_local.py::test_asynchronous_property
distributed/deploy/tests/test_local.py::test_asynchronous_property
distributed/deploy/tests/test_local.py::test_asynchronous_property
distributed/deploy/tests/test_local.py::test_asynchronous_property
distributed/tests/test_client.py::test_dump_cluster_state_error
distributed/tests/test_client.py::test_dump_cluster_state_error
distributed/tests/test_client.py::test_dump_cluster_state_error
distributed/tests/test_client.py::test_dump_cluster_state_error
distributed/tests/test_client.py::test_dump_cluster_state_error
distributed/tests/test_client.py::test_dump_cluster_state_error
distributed/tests/test_client.py::test_get_versions_rpc_error
distributed/tests/test_client.py::test_get_versions_rpc_error
distributed/tests/test_client.py::test_get_versions_rpc_error
distributed/tests/test_client.py::test_get_versions_rpc_error
distributed/tests/test_client.py::test_get_versions_rpc_error
distributed/tests/test_client.py::test_reconnect_timeout
distributed/tests/test_client.py::test_reconnect_timeout
distributed/tests/test_client.py::test_run_rpc_error
distributed/tests/test_client.py::test_run_rpc_error
distributed/tests/test_client.py::test_run_rpc_error
distributed/tests/test_client.py::test_run_rpc_error
distributed/tests/test_failed_workers.py::test_failing_worker_with_additional_replicas_on_cluster
distributed/tests/test_failed_workers.py::test_failing_worker_with_additional_replicas_on_cluster
distributed/tests/test_multi_locks.py::test_timeout_wake_waiter
distributed/tests/test_multi_locks.py::test_timeout_wake_waiter
distributed/tests/test_scheduler.py::test_balance_many_workers
distributed/tests/test_scheduler.py::test_balance_many_workers
distributed/tests/test_scheduler.py::test_balance_many_workers
distributed/tests/test_scheduler.py::test_balance_many_workers
distributed/tests/test_scheduler.py::test_balance_many_workers_2
distributed/tests/test_scheduler.py::test_balance_many_workers_2
distributed/tests/test_scheduler.py::test_balance_many_workers_2
distributed/tests/test_scheduler.py::test_balance_many_workers_2
distributed/tests/test_scheduler.py::test_computations
distributed/tests/test_scheduler.py::test_profile_metadata
distributed/tests/test_scheduler.py::test_profile_metadata
distributed/tests/test_scheduler.py::test_profile_metadata_keys
distributed/tests/test_scheduler.py::test_profile_metadata_keys
distributed/tests/test_scheduler.py::test_profile_metadata_timeout
distributed/tests/test_scheduler.py::test_worker_breaks_and_returns
distributed/tests/test_scheduler.py::test_worker_breaks_and_returns
distributed/tests/test_scheduler.py::test_worker_breaks_and_returns
distributed/tests/test_scheduler.py::test_worker_breaks_and_returns
distributed/tests/test_scheduler.py::test_worker_heartbeat_after_cancel
distributed/tests/test_scheduler.py::test_worker_heartbeat_after_cancel
distributed/tests/test_steal.py::test_dont_steal_fast_tasks_compute_time
distributed/tests/test_steal.py::test_dont_steal_fast_tasks_compute_time
distributed/tests/test_steal.py::test_dont_steal_few_saturated_tasks_many_workers
distributed/tests/test_steal.py::test_dont_steal_few_saturated_tasks_many_workers
distributed/tests/test_steal.py::test_steal_more_attractive_tasks
distributed/tests/test_steal.py::test_steal_more_attractive_tasks
distributed/tests/test_steal.py::test_steal_twice
distributed/tests/test_steal.py::test_steal_twice
distributed/tests/test_steal.py::test_steal_twice
distributed/tests/test_steal.py::test_steal_twice
distributed/tests/test_steal.py::test_steal_when_more_tasks
distributed/tests/test_steal.py::test_steal_when_more_tasks
distributed/tests/test_steal.py::test_worksteal_many_thieves
distributed/tests/test_steal.py::test_worksteal_many_thieves
distributed/tests/test_utils_test.py::test_assert_worker_story_malformed_story[story4]
distributed/tests/test_utils_test.py::test_assert_worker_story_malformed_story[story4]
distributed/tests/test_utils_test.py::test_dump_cluster_unresponsive_remote_worker
distributed/tests/test_utils_test.py::test_dump_cluster_unresponsive_remote_worker
distributed/tests/test_variable.py::test_race
distributed/tests/test_variable.py::test_race
distributed/tests/test_worker.py::test_avoid_oversubscription
distributed/tests/test_worker.py::test_avoid_oversubscription
distributed/tests/test_worker.py::test_avoid_oversubscription
distributed/tests/test_worker.py::test_avoid_oversubscription
distributed/tests/test_worker.py::test_gather_many_small
distributed/tests/test_worker.py::test_gather_many_small
distributed/tests/test_worker.py::test_gather_many_small
distributed/tests/test_worker.py::test_gather_many_small
distributed/tests/test_worker.py::test_lifetime
distributed/tests/test_worker.py::test_lifetime
distributed/tests/test_worker.py::test_lifetime
distributed/tests/test_worker.py::test_lifetime
distributed/tests/test_worker.py::test_pause_executor
distributed/tests/test_worker.py::test_scheduler_delay
distributed/tests/test_worker.py::test_scheduler_delay
distributed/tests/test_worker.py::test_scheduler_delay
distributed/tests/test_worker.py::test_scheduler_delay
distributed/tests/test_worker.py::test_scheduler_delay
distributed/tests/test_worker.py::test_statistical_profiling_cycle
distributed/tests/test_worker.py::test_worker_reconnects_mid_compute
distributed/tests/test_worker.py::test_worker_reconnects_mid_compute
distributed/tests/test_worker.py::test_worker_reconnects_mid_compute
distributed/tests/test_worker.py::test_worker_reconnects_mid_compute
distributed/tests/test_worker.py::test_worker_reconnects_mid_compute
distributed/tests/test_worker.py::test_worker_reconnects_mid_compute_multiple_states_on_scheduler
distributed/tests/test_worker.py::test_worker_reconnects_mid_compute_multiple_states_on_scheduler
distributed/tests/test_worker.py::test_worker_reconnects_mid_compute_multiple_states_on_scheduler
distributed/tests/test_worker.py::test_worker_reconnects_mid_compute_multiple_states_on_scheduler
distributed/tests/test_worker.py::test_worker_reconnects_mid_compute_multiple_states_on_scheduler

Co-authored-by: crusaderky <[email protected]>

gjoseph92 · 2022-02-22T17:21:27Z

@crusaderky comments addressed

distributed/tests/test_nanny.py

distributed/versions.py

Co-authored-by: Thomas Grainger <[email protected]>

distributed/tests/test_nanny.py

Co-authored-by: Thomas Grainger <[email protected]>

graingert · 2022-03-07T12:02:05Z

So it turns out importlib.metadata.version is very slow, adding a functools.cache around it appears to help https://github.com/graingert/distributed/actions/runs/1937969735

main

In [1]: from distributed.versions import get_versions

In [2]: %timeit get_versions()
148 µs ± 567 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)

importlib

In [1]: from distributed.versions import get_versions

In [2]: %timeit get_versions()
12.3 ms ± 151 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

…no-import

mrocklin · 2022-04-19T16:53:44Z

I've handled merge conflicts and pushed to your branch. I hope that you don't mind @gjoseph92

mrocklin · 2022-04-19T19:26:40Z

Looking at the runtimes of the heavily flaky test suites, I'm seeing 1h+ runtime instead of the usual 30min. Which is something I've seen in the past on main. So I suspect it may be github's fault.

This is still happening. I propose that instead maybe this change adds a non-trivial and somewhat stochastic cost to startup time, which has genuinely increased the duration of the test suite.

The good news is, several of these are known flaky tests which seem to have become a lot more flaky in this PR.
This may be a good workbench to finally iron them out.

Yeah, I like this way of thinking. Rather than try to hide the problem, let's expose it more clearly.

However, looking through the test failures that I'm seeing here (just anecdotally skimming) I'm seeing that half of them are things that I often see in practice, and half of them are, I think, unrelated.

At first I was very excited about this PR because it shined a bright light on all of the bad tests. However now I'm concerned that it might not be doing a good job of prioritizing them for us. I think that I still value just going through existing PRs and picking off failing tests from them and seeing if we can solve them. That's less clear signal, but it's also less biased signal.

github-actions · 2022-07-05T12:56:08Z

Unit Test Results

See test report for an extended history of previous test failures. This is useful for diagnosing flaky tests.

      14 files -       1       14 suites - 1 15h 6m 29s ⏱️ + 8h 59m 24s
  2 910 tests +      1   2 794 ✔️ -     29   80 💤 ±  0   35 ❌ +  30 1 🔥 ±0
20 024 runs - 1 517 18 976 ✔️ - 1 623 919 💤 - 16 127 ❌ +121 2 🔥 +1

For more details on these failures and errors, see this check.

Results for commit c72f970. ± Comparison against base commit 7b24c94.

crusaderky · 2022-07-05T15:49:09Z

This is still very red after merging from main.
The very good news is that I'm seeing many recurring offenders among the failed tests.

get_versions without importing packages

9c97bc6

gjoseph92 requested a review from crusaderky January 27, 2022 23:58

gjoseph92 self-assigned this Jan 27, 2022

importlib.metadata backport

5731282

crusaderky reviewed Jan 28, 2022

View reviewed changes

distributed/versions.py Outdated Show resolved Hide resolved

distributed/versions.py Outdated Show resolved Hide resolved

distributed/versions.py Outdated Show resolved Hide resolved

gjoseph92 added a commit to gjoseph92/distributed that referenced this pull request Jan 28, 2022

Test unnecessary imports in nanny tests

ce8e9d2

xfail'd until dask#5724

gjoseph92 added 3 commits January 27, 2022 18:29

use pkg_resources for 3.7 instead of backport

df3d119

remove superfluous type annotation

1dadc3c

empty tuple as default

3b4cb0f

gjoseph92 requested a review from crusaderky January 28, 2022 01:39

crusaderky approved these changes Jan 28, 2022

View reviewed changes

crusaderky closed this Jan 28, 2022

crusaderky reopened this Jan 28, 2022

crusaderky mentioned this pull request Jan 28, 2022

numpy is imported unconditionally #5729

Closed

gjoseph92 mentioned this pull request Jan 28, 2022

Defer pandas import on worker in P2P shuffle #5695

Merged

2 tasks

graingert reviewed Jan 28, 2022

View reviewed changes

distributed/versions.py Outdated Show resolved Hide resolved

conditional on Python version

3b237e8

crusaderky closed this Jan 30, 2022

crusaderky reopened this Jan 30, 2022

crusaderky mentioned this pull request Jan 30, 2022

[DNM] Do not import pandas crusaderky/distributed#2

Closed

gjoseph92 and others added 3 commits February 22, 2022 10:11

Drop 3.7

e8aab1f

Co-authored-by: crusaderky <[email protected]>

Merge branch 'main' into get-versions-no-import

cef6bf4

un-xfail pandas

6bdae99

crusaderky reviewed Feb 23, 2022

View reviewed changes

distributed/tests/test_nanny.py Outdated Show resolved Hide resolved

Update distributed/tests/test_nanny.py

110956d

crusaderky reviewed Feb 23, 2022

View reviewed changes

distributed/tests/test_nanny.py Outdated Show resolved Hide resolved

Update distributed/tests/test_nanny.py

32d6242

graingert requested changes Feb 23, 2022

View reviewed changes

distributed/versions.py Outdated Show resolved Hide resolved

distributed/versions.py Show resolved Hide resolved

crusaderky and others added 2 commits February 23, 2022 13:29

Update distributed/versions.py

eb14462

Co-authored-by: Thomas Grainger <[email protected]>

Update distributed/versions.py

14597ae

Co-authored-by: Thomas Grainger <[email protected]>

graingert requested changes Feb 23, 2022

View reviewed changes

distributed/tests/test_nanny.py Outdated Show resolved Hide resolved

distributed/tests/test_nanny.py Outdated Show resolved Hide resolved

crusaderky and others added 2 commits February 23, 2022 13:43

Update distributed/tests/test_nanny.py

984f5c0

Co-authored-by: Thomas Grainger <[email protected]>

Update distributed/tests/test_nanny.py

b6d99ee

Co-authored-by: Thomas Grainger <[email protected]>

gjoseph92 assigned graingert and unassigned gjoseph92 Mar 1, 2022

crusaderky assigned gjoseph92 and unassigned graingert Mar 1, 2022

fjetter unassigned gjoseph92 Mar 1, 2022

Merge branch 'main' of github.com:dask/distributed into get-versions-…

08210f2

…no-import

Merge remote-tracking branch 'origin/main' into pr/gjoseph92/5724

c72f970

gjoseph92 mentioned this pull request Oct 31, 2022

Include button for launching jupyterlab layout in repr #7218

Merged

gjoseph92 requested a review from fjetter as a code owner January 23, 2024 10:57

Uh oh!

get_versions without importing packages #5724

Are you sure you want to change the base?

get_versions without importing packages #5724

Conversation

gjoseph92 commented Jan 27, 2022 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

gjoseph92 commented Jan 28, 2022 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

crusaderky commented Jan 28, 2022

Uh oh!

Uh oh!

Uh oh!

Uh oh!

gjoseph92 commented Jan 28, 2022

Uh oh!

gjoseph92 commented Jan 28, 2022

Uh oh!

crusaderky commented Jan 28, 2022

Uh oh!

crusaderky commented Jan 28, 2022

Uh oh!

gjoseph92 commented Jan 28, 2022

Uh oh!

Uh oh!

crusaderky commented Jan 28, 2022 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

crusaderky commented Jan 31, 2022

Uh oh!

crusaderky commented Feb 2, 2022

Uh oh!

crusaderky commented Feb 21, 2022

Uh oh!

crusaderky commented Feb 21, 2022

Uh oh!

gjoseph92 commented Feb 22, 2022

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

graingert commented Mar 7, 2022

Uh oh!

mrocklin commented Apr 19, 2022

Uh oh!

mrocklin commented Apr 19, 2022

Uh oh!

github-actions bot commented Jul 5, 2022

Unit Test Results

Uh oh!

crusaderky commented Jul 5, 2022

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants

`get_versions` without importing packages #5724

`get_versions` without importing packages #5724

gjoseph92 commented Jan 27, 2022 •

edited

Loading

gjoseph92 commented Jan 28, 2022 •

edited

Loading

crusaderky commented Jan 28, 2022 •

edited

Loading