utils.py

from collections import namedtuple
import numbers
import itertools

import numpy as np
from scipy import sparse

from sklearn.kernel_approximation import AdditiveChi2Sampler
from sklearn.externals.joblib import Memory, Parallel, delayed
from pystruct.utils import make_grid_edges

DataBunch = namedtuple('DataBunch', 'X, Y, file_names, superpixels')
DataBunchNoSP = namedtuple('DataBunchNoSP', 'X, Y, file_names')

memory = Memory(cachedir="/home/data/amueller/cache", verbose=1)


@memory.cache
def transform_chi2(data):
    chi2 = AdditiveChi2Sampler(sample_steps=2)
    if isinstance(data.X[0], np.ndarray):
        X_new = [chi2.fit_transform(x).astype(np.float32) for x in data.X]
    elif len(data.X[0]) == 2:
        X_new = [(chi2.fit_transform(x[0]), x[1]) for x in data.X]
    elif len(data.X[0]) == 3:
        X_new = [(chi2.fit_transform(x[0]), x[1], x[2]) for x in data.X]
    else:
        raise ValueError("len(x) is weird: %d" % len(data.X[0]))

    return DataBunch(X_new, data.Y, data.file_names, data.superpixels)


@memory.cache
def discard_void(dataset, data, latent_features=False):
    if isinstance(data.X[0], np.ndarray):
        X_new = [x[y != dataset.void_label] for x, y in zip(data.X, data.Y)]
        Y_new = [y[y != dataset.void_label] for y in data.Y]
        return DataBunch(X_new, Y_new, data.file_names,
                         data.superpixels)
    X_new, Y_new = [], []
    for x, y in zip(data.X, data.Y):
        mask = y != dataset.void_label
        voids = np.where(~mask)[0]

        if len(x) == 2:
            features, edges = x
        elif len(x) == 3:
            if isinstance(x[2], numbers.Integral):
                features, edges, n_hidden = x
                mask = np.hstack([mask, np.ones(n_hidden, dtype=np.bool)])
            else:
                features, edges, edge_features = x
                edge_features_new = edge_features
        elif len(x) == 4:
                features, edges, edge_features, n_hidden = x
                edge_features_new = edge_features
                mask = np.hstack([mask, np.ones(n_hidden, dtype=np.bool)])
        else:
            raise ValueError("len(x) is weird: %d" % len(data.X[0]))

        edges_new = edges
        if edges_new.shape[0] > 0:
            # if there are no edges, don't need to filter them
            # also, below code would break ;)
            for void_node in voids:
                involves_void_node = np.any(edges_new == void_node, axis=1)
                edges_new = edges_new[~involves_void_node]
                if (len(x) == 3 and not isinstance(x[2], numbers.Integral) or
                        len(x) == 4):
                    edge_features_new = edge_features_new[~involves_void_node]

        reindex_edges = np.zeros(len(mask), dtype=np.int)
        reindex_edges[mask] = np.arange(np.sum(mask))
        edges_new = reindex_edges[edges_new]
        if len(x) == 2:
            X_new.append((features[mask], edges_new))
            Y_new.append(y[mask])
        elif len(x) == 3:
            if isinstance(x[2], numbers.Integral):
                n_hidden_new = np.max(edges_new) - np.sum(mask[:-n_hidden]) + 1
                if latent_features:
                    X_new.append((features[mask], edges_new, n_hidden_new))
                else:
                    X_new.append((features[mask[:-n_hidden]], edges_new,
                                  n_hidden_new))
                Y_new.append(y[mask[:-n_hidden]])
                #X_new.append((features[mask], edges_new, n_hidden_new))
                #Y_new.append(y[mask[:-n_hidden]])
            else:
                X_new.append((features[mask], edges_new, edge_features_new))
                Y_new.append(y[mask])
        else:
            n_hidden_new = np.max(edges_new) - np.sum(mask[:-n_hidden]) + 1
            X_new.append((features[mask[:-n_hidden]], edges_new,
                          edge_features_new, n_hidden_new))
            Y_new.append(y[mask[:-n_hidden]])
    return DataBunch(X_new, Y_new, data.file_names, data.superpixels)


@memory.cache
def add_edges(data, kind="pairwise"):
    # generate graph
    if kind == "independent":
        X_new = [(x, np.empty((0, 2), dtype=np.int)) for x in data.X]

    elif kind == "extended":
        X_new = [(x, extend_edges(region_graph(sp), length=3))
                 for x, sp in zip(data.X, data.superpixels)]

    elif kind == "fully_connected":
        X_new = [(x, np.vstack([e for e in
                                itertools.combinations(np.arange(len(x)), 2)]))
                 for x in data.X]
    elif kind == "pairwise":
        X_new = [(x, region_graph(sp))
                 for x, sp in zip(data.X, data.superpixels)]
    else:
        raise ValueError("Parameter 'kind' should be one of 'independent'"
                         ",'fully_connected' or 'pairwise', got %s"
                         % kind)

    return DataBunch(X_new, data.Y, data.file_names, data.superpixels)


def radius_graph(superpixels, eps=40):
    n_vertices = np.max(superpixels) + 1
    centers = np.empty((n_vertices, 2))
    gridx, gridy = np.mgrid[:superpixels.shape[0], :superpixels.shape[1]]

    for v in xrange(n_vertices):
        centers[v] = [gridy[superpixels == v].mean(),
                      gridx[superpixels == v].mean()]
    edges = []
    for e in itertools.combinations(np.arange(n_vertices), 2):
        if np.linalg.norm(centers[e[0]] - centers[e[1]]) < eps:
            edges.append(e)
    return np.vstack(edges)


def region_graph(regions):
    edges = make_grid_edges(regions)
    n_vertices = np.max(regions) + 1

    crossings = edges[regions.ravel()[edges[:, 0]]
                      != regions.ravel()[edges[:, 1]]]
    edges = regions.ravel()[crossings]
    edges = np.sort(edges, axis=1)
    crossing_hash = (edges[:, 0] + n_vertices * edges[:, 1])
    # find unique connections
    unique_hash = np.unique(crossing_hash)
    # undo hashing
    unique_crossings = np.c_[unique_hash % n_vertices,
                             unique_hash // n_vertices]
    return unique_crossings


def extend_edges(edges, length=2):
    # returns all paths of length one or two in the graph given by edges
    n_vertices = np.max(edges) + 1
    graph = sparse.coo_matrix((np.ones(len(edges)), edges.T),
                              shape=(n_vertices, n_vertices))
    neighborhood = graph
    for i in range(length - 1):
        graph = graph + neighborhood * graph
    return np.c_[graph.nonzero()]


def get_mean_colors(image, superpixels):
    r = np.bincount(superpixels.ravel(), weights=image[:, :, 0].ravel())
    g = np.bincount(superpixels.ravel(), weights=image[:, :, 1].ravel())
    b = np.bincount(superpixels.ravel(), weights=image[:, :, 2].ravel())
    mean_colors = (np.vstack([r, g, b])
                   / np.bincount(superpixels.ravel())).T / 255.
    return mean_colors


def get_edge_contrast(edges, image, superpixels, gamma=10):
    mean_colors = get_mean_colors(image, superpixels)
    contrasts = [np.exp(-gamma * np.linalg.norm(mean_colors[e[0]]
                                                - mean_colors[e[1]]))
                 for e in edges]
    return np.vstack(contrasts)


def get_edge_depth_diff(edges, depth, superpixels):
    mean_depth = np.bincount(superpixels.ravel(), weights=depth.ravel())
    mean_depth = mean_depth / np.bincount(superpixels.ravel()).T
    #depth_diff = [np.exp(-gamma * np.linalg.norm(mean_depth[e[0]]
                                                #- mean_depth[e[1]]))
                 #for e in edges]
    depth_diff = [(mean_depth[e[0]] - mean_depth[e[1]])
                 for e in edges]
    depth_diff = np.vstack(depth_diff)
    return depth_diff / np.abs(depth_diff).max()


def get_superpixel_centers(superpixels):
    n_vertices = np.max(superpixels) + 1
    centers = np.empty((n_vertices, 2))
    gridx, gridy = np.mgrid[:superpixels.shape[0], :superpixels.shape[1]]
    for v in xrange(n_vertices):
        centers[v] = [gridy[superpixels == v].mean(),
                      gridx[superpixels == v].mean()]
    return centers


def get_center_distances(edges, superpixels):
    centers = get_superpixel_centers(superpixels)
    distances = np.sum((centers[edges[:, 0]] - centers[edges[:, 1]]) ** 2,
                       axis=1)
    distances -= distances.min()
    distances /= distances.max()
    return np.exp(-distances[:, np.newaxis] * 2.)


def get_edge_directions(edges, superpixels):
    centers = get_superpixel_centers(superpixels)

    directions = []
    for edge in edges:
        e0, e1 = edge
        diff = centers[e0] - centers[e1]
        diff /= np.linalg.norm(diff)
        directions.append(np.arcsin(diff[1]))
    return np.vstack(directions)


def get_sp_normals(normals, superpixels):
    normals_flat = normals.reshape(-1, 3)
    n_sp = np.max(superpixels) + 1
    mask = np.isfinite(normals_flat.sum(axis=1))
    superpixels = superpixels.ravel()[mask]
    normals_flat = normals_flat[mask]
    x = np.bincount(superpixels, weights=normals_flat[:, 0], minlength=n_sp)
    y = np.bincount(superpixels, weights=normals_flat[:, 1], minlength=n_sp)
    z = np.bincount(superpixels, weights=normals_flat[:, 2], minlength=n_sp)
    mean_normals = np.vstack([x, y, z]).T
    lengths = np.maximum(1e-3, np.sqrt(np.sum(mean_normals ** 2, axis=1)))
    mean_normals /= lengths[:, np.newaxis]
    return mean_normals


def get_normal_angles(edges, normals, superpixels):
    mean_normals = get_sp_normals(normals, superpixels)

    product = np.sum(mean_normals[edges[:, 0]] * mean_normals[edges[:, 1]], axis=1)
    product[~np.isfinite(product)] = 0
    return (1 - np.arccos(np.abs(product)) * 2. / np.pi)[:, np.newaxis]


def edge_features_single(dataset, x, superpixels, file_name, more_colors=False,
                         depth_diff=False, center_distances=False, normal_angles=False):
    edges = x[1]
    features = [np.ones((edges.shape[0], 1))]
    image = dataset.get_image(file_name)
    if more_colors:
        features.append(get_edge_contrast(edges, image, superpixels,
                                          gamma=5))
        features.append(get_edge_contrast(edges, image, superpixels,
                                          gamma=10))
        features.append(get_edge_contrast(edges, image, superpixels,
                                          gamma=20))
        features.append(get_edge_contrast(edges, image, superpixels,
                                          gamma=100))
    else:
        features.append(get_edge_contrast(edges, image, superpixels,
                                          gamma=10))
    if depth_diff:
        depth = dataset.get_depth(file_name)
        features.append(get_edge_depth_diff(edges, depth, superpixels))

    if center_distances:
        features.append(get_center_distances(edges, superpixels))

    if normal_angles:
        normals = dataset.get_pointcloud_normals(file_name)[:, :, 3:]
        features.append(get_normal_angles(edges, normals, superpixels))

    features.append(get_edge_directions(edges, superpixels))
    return np.hstack(features)


@memory.cache
def add_edge_features(dataset, data, more_colors=False, center_distances=False,
                      depth_diff=False, normal_angles=False):
    # trigger cache ..
    all_edge_features = Parallel(n_jobs=1, verbose=4)(
        delayed(edge_features_single)(dataset, x, superpixels, file_name,
                                      more_colors=more_colors,
                                      center_distances=center_distances,
                                      depth_diff=depth_diff, normal_angles=normal_angles)
        for x, superpixels, file_name in zip(data.X, data.superpixels,
                                             data.file_names))
    X = [(x[0], x[1], features) for x, features in zip(data.X, all_edge_features)]
    return DataBunch(X, data.Y, data.file_names, data.superpixels)


def gt_in_sp(dataset, filename, superpixels):
    y = dataset.get_ground_truth(filename)
    votes = sparse.coo_matrix((np.ones(superpixels.size),
                               (y.ravel(), superpixels.ravel())))
    return np.argmax(votes.toarray(), axis=0)


def eval_on_pixels(dataset, Y_true, Y_pred, print_results=False):
    n_classes = len(dataset.classes) - 1  # -1 for void
    tp, tn, fp, fn = [np.zeros(n_classes) for i in xrange(4)]
    correct, total = 0, 0
    for y_true, y_pred in zip(Y_true, Y_pred):
        mask = y_true != dataset.void_label
        y_true, y_pred = y_true[mask], y_pred[mask]
        correct += np.sum(y_true == y_pred)
        total += len(y_true)
        for k in range(n_classes):
            tp[k] += np.sum((y_true == k) * (y_pred == k))
            tn[k] += np.sum((y_true != k) * (y_pred != k))
            fp[k] += np.sum((y_true != k) * (y_pred == k))
            fn[k] += np.sum((y_true == k) * (y_pred != k))
    jaccard = tp / (fp + fn + tp) * 100
    hamming = tp / (tp + fn) * 100
    if print_results:
        np.set_printoptions(precision=2)
        print("Jaccard")
        print(jaccard)
        print("Hamming")
        print(hamming)
        print("Mean Jaccard: %.1f   Mean Hamming: %.1f"
              % (np.mean(jaccard), np.mean(hamming)))
        print("Total : %.1f" % (correct / float(total) * 100))

    return hamming, jaccard


def eval_on_sp(dataset, data, Y_pred, print_results=False):
    Y_pred_pixels = [y_pred[sp] for sp, y_pred in zip(data.superpixels,
                                                      Y_pred)]
    Y_true = [dataset.get_ground_truth(f) for f in data.file_names]
    return eval_on_pixels(dataset, Y_true, Y_pred_pixels,
                          print_results=print_results)


@memory.cache
def add_global_descriptor(data):
    # adds to each superpixel a feature consisting of the average over the
    # image
    global_descs = map(lambda x: x.sum(axis=0) / x.shape[0], data.X)
    X_new = [np.hstack([x, np.repeat(d[np.newaxis, :], x.shape[0], axis=0)])
             for d, x in zip(global_descs, data.X)]
    return DataBunch(X_new, data.Y, data.file_names, data.superpixels)


def probabilities_on_sp(ds, probabilities, superpixels, add_covariance=False):
    # accumulate votes in superpixels
    # interleaved repeat
    n_classes = len(ds.classes) - 1
    class_indices = np.repeat(np.arange(n_classes)[np.newaxis, :],
                              superpixels.size, axis=0).ravel()
    # non-interleaved repeat
    superpixel_indices = np.repeat(superpixels.ravel(), n_classes)
    sp_probs = sparse.coo_matrix((probabilities.ravel(),
                                  (superpixel_indices, class_indices)))
    sp_probs = sp_probs.toarray().astype(np.float)
    # renormalize (same as dividing by sp sizes)
    sp_probs =  sp_probs / sp_probs.sum(axis=-1)[:, np.newaxis]
    if add_covariance:
        covars = []
        for i in np.unique(superpixels):
            covars.append(np.cov(probabilities[superpixels == i].T).ravel())
        return np.hstack([sp_probs, np.array(covars)])
    return sp_probs