Refactor API

theislab · Lilly-May · Apr 7, 2024 · Mar 27, 2024 · Mar 28, 2024 · Mar 28, 2024
commit 1e1acf2cb1ffd019f47dc8cab0da66f21740f064
diff --git a/docs/usage/usage.md b/docs/usage/usage.md
@@ -196,7 +196,7 @@ In contrast to a preprocessing function, a tool usually adds an easily interpret
     tools.paga
 ```
 
-### Group comparison
+### Feature Ranking
 
 ```{eval-rst}
 .. autosummary::
@@ -205,6 +205,7 @@ In contrast to a preprocessing function, a tool usually adds an easily interpret
 
     tools.rank_features_groups
     tools.filter_rank_features_groups
+    tools.rank_features_supervised
 ```
 
 ### Dataset integration
@@ -358,7 +359,7 @@ Visualize clusters using one of the embedding methods passing color='leiden'.
     plot.paga_compare
 ```
 
-### Group comparison
+### Feature Ranking
 
 ```{eval-rst}
 .. autosummary::
@@ -372,6 +373,7 @@ Visualize clusters using one of the embedding methods passing color='leiden'.
     plot.rank_features_groups_dotplot
     plot.rank_features_groups_matrixplot
     plot.rank_features_groups_tracksplot
+    plot.rank_features_supervised
 ```
 
 ### Survival Analysis

diff --git a/ehrapy/plot/supervised/__init__.py → ehrapy/plot/feature_ranking/__init__.py b/ehrapy/plot/supervised/__init__.py → ehrapy/plot/feature_ranking/__init__.py
diff --git a/...y/plot/supervised/_feature_importances.py → ...t/feature_ranking/_feature_importances.py b/...y/plot/supervised/_feature_importances.py → ...t/feature_ranking/_feature_importances.py
@@ -7,7 +7,7 @@
 from matplotlib.axes import Axes
 
 
-def feature_importances(
+def rank_features_supervised(
     adata: AnnData,
     key: str = "feature_importances",
     n_features: int = 10,

diff --git a/ehrapy/tools/__init__.py b/ehrapy/tools/__init__.py
@@ -14,8 +14,8 @@
 from ehrapy.tools._scanpy_tl_api import *  # noqa: F403
 from ehrapy.tools.causal._dowhy import causal_inference
 from ehrapy.tools.cohort_tracking._cohort_tracker import CohortTracker
+from ehrapy.tools.feature_ranking._feature_importances import rank_features_supervised
 from ehrapy.tools.feature_ranking._rank_features_groups import filter_rank_features_groups, rank_features_groups
-from ehrapy.tools.supervised._feature_importances import feature_importances
 
 try:  # pragma: no cover
     from ehrapy.tools.nlp._medcat import (

diff --git a/.../tools/supervised/_feature_importances.py → ...s/feature_ranking/_feature_importances.py b/.../tools/supervised/_feature_importances.py → ...s/feature_ranking/_feature_importances.py
@@ -13,7 +13,7 @@
 from ehrapy.anndata import anndata_to_df
 
 
-def feature_importances(
+def rank_features_supervised(
     adata: AnnData,
     predicted_feature: str,
     prediction_type: Literal["continuous", "categorical"],
@@ -26,7 +26,7 @@ def feature_importances(
     percent_output: bool = False,
     **kwargs,
 ):
-    """Calculate feature importances for predicting a specified feature in adata.var using a given model.
+    """Calculate feature importances for predicting a specified feature in adata.var.
 
     Args:
         adata: :class:`~anndata.AnnData` object storing the data.

diff --git a/ehrapy/tools/supervised/__init__.py b/ehrapy/tools/supervised/__init__.py
diff --git a/tests/tools/supervised/test_feature_importances.py b/tests/tools/supervised/test_feature_importances.py
@@ -5,7 +5,7 @@
 import pytest
 from anndata import AnnData
 
-from ehrapy.tools import feature_importances
+from ehrapy.tools import rank_features_supervised
 
 
 def test_continuous_prediction():
@@ -15,7 +15,7 @@ def test_continuous_prediction():
     adata.var_names = ["target", "feature1", "feature2"]
 
     for model in ["regression", "svm", "rf"]:
-        feature_importances(adata, "target", "continuous", model, "all")
+        rank_features_supervised(adata, "target", "continuous", model, "all")
         assert "feature_importances" in adata.var
         assert adata.var["feature_importances"]["feature1"] > 0
         assert adata.var["feature_importances"]["feature2"] == 0
@@ -30,7 +30,7 @@ def test_categorical_prediction():
     adata.var_names = ["target", "feature1", "feature2"]
 
     for model in ["regression", "svm", "rf"]:
-        feature_importances(adata, "target", "categorical", model, "all")
+        rank_features_supervised(adata, "target", "categorical", model, "all")
         assert "feature_importances" in adata.var
         assert adata.var["feature_importances"]["feature1"] > 0
         assert adata.var["feature_importances"]["feature2"] == 0
@@ -44,13 +44,13 @@ def test_multiclass_prediction():
     adata = AnnData(X)
     adata.var_names = ["target", "feature1", "feature2"]
 
-    feature_importances(adata, "target", "categorical", "rf", "all")
+    rank_features_supervised(adata, "target", "categorical", "rf", "all")
     assert "feature_importances" in adata.var
     assert adata.var["feature_importances"]["feature1"] > 0
     assert adata.var["feature_importances"]["feature2"] == 0
     assert pd.isna(adata.var["feature_importances"]["target"])
 
     for invalid_model in ["regression", "svm"]:
         with pytest.raises(ValueError) as excinfo:
-            feature_importances(adata, "target", "categorical", invalid_model, "all")
+            rank_features_supervised(adata, "target", "categorical", invalid_model, "all")
         assert str(excinfo.value).startswith("Feature target has more than two categories.")