Source code for scannerpy.column

import struct
import math
import tempfile
import os
from subprocess import Popen, PIPE
from concurrent.futures import ThreadPoolExecutor
import multiprocessing as mp
import numpy as np

from storehouse import RandomReadFile
from scannerpy.common import *
from scannerpy.job import Job
from scannerpy import types as scannertypes
from scannerpy.protobufs import protobufs
from scannerpy.storage import NamedVideoStream, NamedStream, NullElement



LOAD_SPARSITY_THRESHOLD = 10

[docs]class Column(object):
    """
    A column of a Table.
    """

    def __init__(self, table, name):
        self._table = table
        self._name = name
        self._sc = table._sc
        self._storage = table._sc.config.storage
        self._db_path = table._sc.config.db_path

        self._loaded = False
        self._descriptor = None
        self._video_descriptor = None

    def _load_meta(self):
        if not self._loaded:
            self._loaded = True
            descriptor, video_descriptor = self._table._load_column(self._name)
            self._descriptor = descriptor
            self._video_descriptor = video_descriptor

[docs]    def name(self):
        return self._name

[docs]    def type(self):
        self._load_meta()
        return self._descriptor.type

[docs]    def id(self):
        self._load_meta()
        return self._descriptor.id

[docs]    def keyframes(self):
        self._load_meta()
        if (self._descriptor.type == protobufs.Video
                and self._video_descriptor.codec_type ==
                protobufs.VideoDescriptor.H264):
            # For each encoded video, add start frame offset
            frame_offset = 0
            kf_offset = 0
            keyframes = []
            for frames_per_video, kfs_per_video in zip(
                    self._video_descriptor.frames_per_video,
                    self._video_descriptor.keyframes_per_video):
                keyframes += [
                    frame_offset + kfi
                    for kfi in self._video_descriptor.keyframe_indices[
                        kf_offset:kf_offset + kfs_per_video]
                ]
                frame_offset += frames_per_video
                kf_offset += kfs_per_video
            return keyframes
        else:
            return list(range(self._table.num_rows()))

    def _load_output_file(self, item_id, rows, fn=None):
        assert len(rows) > 0

        metadata_path = '{}/tables/{}/{}_{}_metadata.bin'.format(
            self._db_path, self._table._descriptor.id, self._descriptor.id,
            item_id)
        try:
            metadata_file = RandomReadFile(self._storage, metadata_path)
        except UserWarning:
            raise ScannerException(
                'Path {} does not exist'.format(metadata_path))

        data_path = '{}/tables/{}/{}_{}.bin'.format(
            self._db_path, self._table._descriptor.id, self._descriptor.id,
            item_id)
        try:
            data_file = RandomReadFile(self._storage, data_path)
        except UserWarning:
            raise ScannerException('Path {} does not exist'.format(path))

        # HACK: this should get eliminated once metadata format saves offsets instead of lengths
        last_row_edge_case = rows == [self._table._descriptor.end_rows[-1] - 1]
        if last_row_edge_case:
            size = metadata_file.size()
            metadata_file.seek(size - 8)
            (buf_len, ) = struct.unpack('=Q', metadata_file.read(8))
            data_file.seek(data_file.size() - buf_len)
            buf = data_file.read(buf_len)
            if len(buf) == 0:
                yield NullElement()
            elif fn is not None:
                yield fn(buf)
            else:
                yield buf
            return

        sparse_load = len(rows) > 1 and \
                      np.array([rows[i+1] - rows[i] for i in range(len(rows)-1)]).mean() > LOAD_SPARSITY_THRESHOLD

        metadata_contents = metadata_file.read()
        if not sparse_load:
            data_contents = data_file.read()

        lens = []
        total_rows = 0
        i = 0
        while i < len(metadata_contents):
            (num_rows, ) = struct.unpack("=Q", metadata_contents[i:i + 8])
            total_rows += num_rows
            i += 8
            for fi in range(num_rows):
                (buf_len, ) = struct.unpack("=Q", metadata_contents[i:i + 8])
                lens.append(buf_len)
                i += 8

        start_pos = None
        pos = 0
        rows = rows if len(rows) > 0 else list(range(total_rows))
        for fi in range(total_rows):
            old_pos = pos
            pos += lens[fi]
            if start_pos is None:
                start_pos = old_pos

        rows_idx = 0
        i = start_pos
        for j, buf_len in enumerate(lens):
            if rows_idx < len(rows) and j == rows[rows_idx]:
                if sparse_load:
                    data_file.seek(i)
                    buf = data_file.read(buf_len)
                else:
                    buf = data_contents[i:i + buf_len]
                assert len(buf) == buf_len

                # len(buf) == 0 when element is null
                if len(buf) == 0:
                    yield NullElement()
                elif fn is not None:
                    yield fn(buf)
                else:
                    yield buf
                rows_idx += 1
            i += buf_len

    def _load(self, fn=None, rows=None, workers=None):
        table_descriptor = self._table._descriptor
        total_rows = table_descriptor.end_rows[-1]

        # Integer divide, round up
        num_items = len(table_descriptor.end_rows)
        bufs = []
        input_rows = list(range(self._table.num_rows()))
        assert len(input_rows) == total_rows
        i = 0
        rows_so_far = 0
        rows_idx = 0
        rows = list(range(total_rows)) if rows is None else rows
        prev = 0
        io_requests = []
        for item_id in range(num_items):
            start_row = prev
            end_row = table_descriptor.end_rows[item_id]
            item_rows = end_row - start_row
            prev = end_row
            select_rows = []
            while rows_idx < len(rows):
                r = rows[rows_idx]
                if r >= start_row and r < end_row:
                    select_rows.append(r - start_row)
                    rows_idx += 1
                else:
                    break
            if select_rows:
                io_requests.append((item_id, select_rows))
            rows_so_far += item_rows

        def eager(item_id, select_rows):
            return [x for x in self._load_output_file(item_id, select_rows, fn)]

        # Start processing io requests in parallel
        # FIXME: https://github.com/scanner-research/scanner/issues/236
        loaded_data = []
        with ThreadPoolExecutor(max_workers=workers) as executor:
            for i in range(min(workers, len(io_requests))):
                item_id, select_rows = io_requests[i]
                loaded_data.append(executor.submit(eager, item_id, select_rows))

            for i in range(len(io_requests)):
                if len(loaded_data) < len(io_requests):
                    item_id, select_rows = io_requests[workers + i]
                    loaded_data.append(executor.submit(eager, item_id, select_rows))
                for output in loaded_data[i].result():
                    yield output

    # TODO(wcrichto): don't show progress bar when running decode png
[docs]    def load(self, ty=None, fn=None, rows=None, workers=16):
        """
        Loads the results of a Scanner computation into Python.

        Kwargs:
            fn: Optional function to apply to the binary blobs as they are read
                in.

        Returns:
            Generator that yields either a numpy array for frame columns or
            a binary blob for non-frame columns (optionally processed by the
            `fn`).
        """

        self._load_meta()
        # If the column is a video, then dump the requested frames to disk as
        # PNGs and return the decoded PNGs
        if (self._descriptor.type == protobufs.Video
                and self._video_descriptor.codec_type ==
                protobufs.VideoDescriptor.H264):
            png_table_name = self._sc._png_dump_prefix.format(
                self._table.name(), self._name)
            frame = self._sc.io.Input([NamedVideoStream(self._sc, self._table.name())])
            enc_input = frame
            if rows is not None:
                sampled_frame = self._sc.streams.Gather(frame, indices=[rows])
                enc_input = sampled_frame
            img = self._sc.ops.ImageEncoder(frame=enc_input)
            output = [NamedStream(self._sc, png_table_name)]
            output_op = self._sc.io.Output(img, output)
            self._sc.run(output_op, PerfParams.estimate(), cache_mode=CacheMode.Overwrite, show_progress=False)
            return output[0].load()
        elif self._descriptor.type == protobufs.Video:
            frame_type = self._video_descriptor.frame_type
            if frame_type == protobufs.U8:
                dtype = np.uint8
            elif frame_type == protobufs.F32:
                dtype = np.float32
            elif frame_type == protobufs.F64:
                dtype = np.float64

            def raw_frame_gen(shape0, shape1, shape2, typ):
                def parser(bufs):
                    output = np.frombuffer(bufs, dtype=typ)
                    return output.reshape((shape0, shape1, shape2))

                return parser

            parser_fn = raw_frame_gen(
                self._video_descriptor.height, self._video_descriptor.width,
                self._video_descriptor.channels, dtype)
            return self._load(fn=parser_fn, rows=rows, workers=workers)
        else:
            # Use a deserialize function if provided.
            # If not, use a type if provided.
            # If not, attempt to determine the type from the column's table descriptor.
            # If that doesn't work, then assume no deserialization function, and return bytes.
            if fn is None:
                if ty is None:
                    type_name = self._descriptor.type_name
                    if type_name != "":
                        ty = scannertypes.get_type_info_cpp(type_name)

                if ty is not None:
                    fn = ty.deserialize


            return self._load(fn, rows=rows, workers=workers)

[docs]    def save_mp4(self, output_name, fps=None, scale=None):
        self._load_meta()
        if not (self._descriptor.type == protobufs.Video
                and (self._video_descriptor.codec_type ==
                protobufs.VideoDescriptor.H264 or self._video_descriptor.codec_type == protobufs.VideoDescriptor.HEVC)):
            raise ScannerException('Attempted to save a non-h264-compressed or non-hevc-compressed'
                                   'column as an mp4. Try compressing the '
                                   'column first by saving the output as '
                                   'an RGB24 frame')
        if self._video_descriptor.codec_type == protobufs.VideoDescriptor.H264:
            log.info("Saving H264 bitstream as an mp4")
            encode_lib = 'libx264'
        elif self._video_descriptor.codec_type == protobufs.VideoDescriptor.HEVC:
            log.info("Saving HEVC bitstream as an mp4")
            encode_lib = 'libx265'

        num_items = len(self._table._descriptor.end_rows)

        paths = [
            '{}/tables/{:d}/{:d}_{:d}.bin'.format(self._sc._db_path,
                                                  self._table._descriptor.id,
                                                  self._descriptor.id, item_id)
            for item_id in range(num_items)
        ]
        temp_paths = []
        for _ in range(len(paths)):
            fd, p = tempfile.mkstemp()
            os.close(fd)
            temp_paths.append(p)
        # Copy all files locally before calling ffmpeg
        for in_path, temp_path in zip(paths, temp_paths):
            with open(temp_path, 'wb') as f:
                f.write(self._storage.read(in_path))

        files = '|'.join(temp_paths)

        vid_fps = (fps or (1.0 / (self._video_descriptor.time_base_num / float(
            self._video_descriptor.time_base_denom))))

        args = ''
        if scale:
            args += '-filter:v "scale={:d}x{:d}" '.format(scale[0], scale[1])

        cmd = (
            'ffmpeg -y '
            '-r {fps:f} '  # set the input fps
            '-i "concat:{input_files:s}" '  # concatenate the h264 files
            '-c:v {encode_lib:s} '
            '-filter:v "setpts=N" '  # h264 does not have pts' in it
            '-loglevel panic '
            '{extra_args:s}'
            '{output_name:s}.mp4'.format(
                input_files=files,
                fps=vid_fps,
                extra_args=args,
                output_name=output_name,
                encode_lib=encode_lib))
        rc = Popen(cmd, shell=True).wait()
        if rc != 0:
            raise ScannerException('ffmpeg failed during mp4 export!')
Quick search

Source code for scannerpy.column