Python gauss_ci_suffstat Examples, causaldag.utils.ci_tests.gauss_ci_suffstat Python Examples

Example #1

0

Show file

File: run_igsp.py Project: csquires/utigsp

    def _run_igsp(dag_num):
        # === GENERATE FILENAME
        sample_folder = sample_folders[dag_num]
        alg_folder = os.path.join(sample_folder, 'estimates', 'igsp')
        os.makedirs(alg_folder, exist_ok=True)
        filename = os.path.join(
            alg_folder,
            'nruns=%d,depth=%d,alpha=%.2e,alpha_invariant=%.2e.npy' %
            (nruns, depth, alpha, alpha_invariant))

        # === RUN ALGORITHM
        if not os.path.exists(filename) or overwrite:
            obs_samples, setting_list, sample_dict = get_dag_samples(
                ndags,
                nnodes,
                nneighbors,
                nsamples,
                nsettings,
                num_known,
                num_unknown,
                intervention,
                dag_num,
                nonlinear=nonlinear)

            if nonlinear:
                suffstat = gauss_ci_suffstat(obs_samples)
                suffstat_inv = gauss_invariance_suffstat(
                    obs_samples,
                    [setting['samples'] for setting in setting_list])
                ci_tester = MemoizedCI_Tester(gauss_ci_test,
                                              suffstat,
                                              alpha=alpha)
                inv_tester = MemoizedInvarianceTester(gauss_invariance_test,
                                                      suffstat_inv,
                                                      alpha=alpha_invariant)
            else:
                suffstat = gauss_ci_suffstat(obs_samples)
                suffstat_inv = gauss_invariance_suffstat(
                    obs_samples,
                    [setting['samples'] for setting in setting_list])
                ci_tester = MemoizedCI_Tester(gauss_ci_test,
                                              suffstat,
                                              alpha=alpha)
                inv_tester = MemoizedInvarianceTester(gauss_invariance_test,
                                                      suffstat_inv,
                                                      alpha=alpha_invariant)

            est_dag = igsp([{
                'interventions': setting['known_interventions']
            } for setting in setting_list],
                           nodes,
                           ci_tester,
                           inv_tester,
                           depth=depth,
                           nruns=nruns)

            np.save(filename, est_dag.to_amat()[0])
            return est_dag
        else:
            return cd.DAG.from_amat(np.load(filename))

Example #2

0

Show file

    def run_fci(graph_num):
        results_filename = get_alg_estimate_filename(ngraphs,
                                                     nnodes,
                                                     nlatent,
                                                     exp_nbrs,
                                                     graph_num,
                                                     nsamples,
                                                     GSPO_NAME,
                                                     alpha=alpha,
                                                     initial=initial,
                                                     depth=depth,
                                                     max_iters=max_iters)
        time_filename = get_alg_time_filename(ngraphs,
                                              nnodes,
                                              nlatent,
                                              exp_nbrs,
                                              graph_num,
                                              nsamples,
                                              GSPO_NAME,
                                              alpha=alpha,
                                              initial=initial,
                                              depth=depth,
                                              max_iters=max_iters)

        if OVERWRITE or not os.path.exists(results_filename):
            samples = get_mag_samples(ngraphs, nnodes, nlatent, exp_nbrs,
                                      graph_num, nsamples)
            start = time.time()
            suffstat = gauss_ci_suffstat(samples)
            ci_tester = MemoizedCI_Tester(gauss_ci_test, suffstat, alpha=alpha)
            est_mag = gspo(set(range(nnodes)),
                           ci_tester,
                           initial_imap=initial,
                           depth=depth,
                           nruns=nruns,
                           max_iters=max_iters,
                           make_minimal=lmc_update)
            time_used = time.time() - start

            os.makedirs(os.path.dirname(results_filename), exist_ok=True)
            np.save(results_filename, est_mag.to_amat())
            np.save(time_filename, time_used)
            return est_mag, time_used
        else:
            time_used = np.load(time_filename)
            return cd.AncestralGraph.from_amat(
                np.load(results_filename)), time_used

Example #3

0

Show file

File: gsp.py Project: uhlerlab/covid19_repurposing

def run_gsp(X,
            alpha,
            nodes: set,
            depth: Optional[int] = 4,
            nruns: int = 5,
            verbose: bool = False,
            initial_undirected: Optional[Union[str,
                                               UndirectedGraph]] = 'threshold',
            initial_permutations: Optional[List] = None,
            fixed_orders=set(),
            fixed_adjacencies=set(),
            fixed_gaps=set(),
            use_lowest=True,
            max_iters=float('inf'),
            factor=2,
            progress_bar=False,
            summarize=False):
    # obtain sufficient statistics (causaldag.utils.ci_tests)
    obs_suffstat = gauss_ci_suffstat(X, invert=False)

    # define CI tester
    ci_tester = MemoizedCI_Tester(gauss_ci_test, obs_suffstat, alpha=alpha)

    # run GSP
    est_dag = gsp(nodes=nodes,
                  ci_tester=ci_tester,
                  depth=depth,
                  nruns=nruns,
                  verbose=verbose,
                  initial_undirected=initial_undirected,
                  initial_permutations=initial_permutations,
                  fixed_orders=fixed_orders,
                  fixed_adjacencies=fixed_adjacencies,
                  fixed_gaps=fixed_gaps,
                  use_lowest=use_lowest,
                  max_iters=max_iters,
                  factor=factor,
                  progress_bar=progress_bar,
                  summarize=summarize)

    # convert dag to adjacency matrix, here specifying that the columns are "source" axis, so edge from j->i
    est_cpdag, _ = est_dag.cpdag().to_amat(source_axis=1)

    return est_cpdag

Example #4

0

Show file

File: igsp.py Project: utkuoguzman/dcdi

def prepare_igsp(obs_samples,
                 iv_samples_list,
                 targets_list,
                 alpha=1e-3,
                 alpha_inv=1e-3,
                 ci_test="gaussian"):

    # Form sufficient statistics
    if ci_test == "gaussian":
        obs_suffstat = gauss_ci_suffstat(obs_samples)
        invariance_suffstat = gauss_invariance_suffstat(
            obs_samples, iv_samples_list)

        # Create CI and invariance
        ci_tester = MemoizedCI_Tester(gauss_ci_test, obs_suffstat, alpha=alpha)
        invariance_tester = MemoizedInvarianceTester(gauss_invariance_test,
                                                     invariance_suffstat,
                                                     alpha=alpha_inv)
    elif ci_test == "hsic":
        contexts = {i: s for i, s in enumerate(iv_samples_list)}
        invariance_suffstat = {"obs_samples": obs_samples}
        invariance_suffstat.update(contexts)

        # Create CI and invariance
        ci_tester = MemoizedCI_Tester(hsic_test, obs_samples, alpha=alpha)
        invariance_tester = MemoizedInvarianceTester(hsic_invariance_test,
                                                     invariance_suffstat,
                                                     alpha=alpha_inv)
    elif ci_test == "kci":
        contexts = {i: s for i, s in enumerate(iv_samples_list)}
        invariance_suffstat = {"obs_samples": obs_samples}
        invariance_suffstat.update(contexts)

        # Create CI and invariance
        ci_tester = MemoizedCI_Tester(kci_test, obs_samples, alpha=alpha)
        invariance_tester = MemoizedInvarianceTester(kci_invariance_test,
                                                     invariance_suffstat,
                                                     alpha=alpha_inv)
    else:
        raise ValueError(
            f"CI test '{ci_test}' does not exist. Choose between: [gaussian, hsic, kci]"
        )
    return ci_tester, invariance_tester

Example #5

0

Show file

from tqdm import tqdm
os.makedirs(ESTIMATED_FOLDER, exist_ok=True)
import json

OVERWRITE = True

# === LOAD SAMPLES
sample_dict = dict()
for file in os.listdir(SACHS_DATA_FOLDER):
    samples = pd.read_csv(os.path.join(SACHS_DATA_FOLDER, file), sep=',')
    iv_str = file.split('=')[1][:-4]
    ivs = frozenset({int(iv_str)}) if iv_str != '' else frozenset()
    sample_dict[ivs] = samples.values
obs_samples = sample_dict[frozenset()]
all_samples = np.concatenate(tuple(sample_dict.values()), axis=0)
suffstat = gauss_ci_suffstat(obs_samples)
suffstat_all = dict(C=np.corrcoef(all_samples, rowvar=False), n=all_samples.shape[0])

setting_list = [
    {'known_interventions': iv_nodes}
    for iv_nodes, samples in sample_dict.items()
    if iv_nodes != frozenset()
]
iv_samples_list = [sample_dict[setting['known_interventions']] for setting in setting_list]
invariance_suffstat = gauss_invariance_suffstat(obs_samples, iv_samples_list)
hsic_invariance_suffstat = {iv: samples for iv, samples in enumerate(iv_samples_list)}
hsic_invariance_suffstat['obs_samples'] = obs_samples

# === RUN UNKNOWN TARGET IGSP WITH GAUSS CI
for alpha in tqdm([1e-1, 1e-2, 1e-3, 2e-1, 3e-1, 4e-1, 5e-1, 5e-2]):
    alpha_i = 1e-20

Example #6

0

Show file

File: profile_pc.py Project: uhlerlab/causaldag

from line_profiler import LineProfiler
import causaldag as cd
from causaldag.inference.structural import pcalg, skeleton
import numpy as np
from causaldag.utils.ci_tests import MemoizedCI_Tester, gauss_ci_suffstat, gauss_ci_test
import random
np.random.seed(1729)
random.seed(1729)

nnodes = 20
nodes = set(range(nnodes))
g = cd.rand.rand_weights(cd.rand.directed_erdos(nnodes, 3/(nnodes-1), 1))
iv_node = random
nsamples = 1000
samples = g.sample(nsamples)
suffstat = gauss_ci_suffstat(samples)
profiler = LineProfiler()


def run_pc():
    for i in range(100):
        ci_tester = MemoizedCI_Tester(gauss_ci_test, suffstat)
        pcalg(nodes, ci_tester, max_cond_set=None, verbose=True)


profiler.add_function(pcalg)
profiler.runcall(run_pc)
profiler.print_stats()

Example #7

0

Show file